推荐算法日报 - 2026-04-30

type

Post

status

Published

date

Apr 30, 2026 05:00

slug

daily-report-2026-04-30

summary

生成式推荐全面渗透重排与召回：今日多篇论文（GloRank、RecoChain）将推荐问题从传统的“索引选择”或“向量检索”范式，转向基于语义ID的“Token生成”范式。这标志着生成式推荐正从单一的召回/排序模块，向统一全链路的架构演进，有望从根本上改变推荐系统的设计哲学。; 工业界聚焦训练基础设施效率革命：Meta的论文揭示了超长用户序列训练中“数据冗余”这一被忽视的瓶颈，并提出“延迟物化”范式。这表明当模型架构（如HSTU）接近天花板时，数据基础设施的优化成为提升模型效果的关键杠杆，是工业

Section 1: 📊 Trend Analysis

🔥 生成式推荐全面渗透重排与召回：今日多篇论文（GloRank、RecoChain）将推荐问题从传统的“索引选择”或“向量检索”范式，转向基于语义ID的“Token生成”范式。这标志着生成式推荐正从单一的召回/排序模块，向统一全链路的架构演进，有望从根本上改变推荐系统的设计哲学。

💡 工业界聚焦训练基础设施效率革命：Meta的论文揭示了超长用户序列训练中“数据冗余”这一被忽视的瓶颈，并提出“延迟物化”范式。这表明当模型架构（如HSTU）接近天花板时，数据基础设施的优化成为提升模型效果的关键杠杆，是工业界降本增效的务实方向。

⚖️ 公平性研究从算法设计走向度量体系反思：除了提出新的公平重排序算法（ManifoldRank），学术界开始系统性地审视现有公平性评估度量的理论缺陷和实际局限性。这提醒从业者，在部署公平性算法前，必须深入理解所用度量的“潜规则”，避免产生误导性的评估结果。

Section 2: 📋 今日速览

今日速览

快手&港城大提出生成式重排GloRank，线上A/B验证有效 ↗

Meta 提出延迟物化范式，消除超长序列训练数据冗余 ↗

人大&蒙特利尔大学用市场均衡统一公平重排序，提出ManifoldRank ↗

快手提出RecoChain，用单一Transformer统一生成式检索与排序 ↗

快手提出OCARM蒸馏框架，用后转化内容提升留存预测 ↗

哥本哈根大学系统分析推荐系统公平性离线评估度量的局限性 ↗

中科院&快手提出NF-NPCDR，用神经过程+归一化流建模跨域多兴趣 ↗

Section 3: 📰 Daily Digest

1. From Local Indices to Global Identifiers: Generative Reranking for Recommender Systems via Global Action Space

🔗 原文： https://arxiv.org/abs/2604.25291

🏷️ 来源： 🤝 产学合作 | City University of Hong Kong, Kuaishou Technology

⭐ 评分： ⭐⭐⭐⭐⭐ (5/5)

🎯 推荐理由： 生成式重排：从局部索引到全局标识符，线上验证有效。

📝 摘要： 针对传统重排模型因“局部索引”动作空间导致语义不一致的问题，本文提出GloRank，将重排任务从“选择索引”转变为“生成全局标识符”。该方法将物品表示为离散Token序列，通过两阶段优化（监督预训练+强化学习后训练）直接优化列表效用。实验在公开数据集和快手大规模工业数据集上均取得SOTA效果，线上A/B测试也验证了其有效性，尤其在冷启场景下鲁棒性更强。该工作为生成式推荐在重排阶段的落地提供了重要参考。

2. Versioned Late Materialization for Ultra-Long Sequence Training in Recommendation Systems at Scale

🔗 原文： https://arxiv.org/abs/2604.24806

🏷️ 来源： 🏭 工业界 | Meta

⭐ 评分： ⭐⭐⭐⭐⭐ (5/5)

🎯 推荐理由： 消除超长序列训练数据冗余，实现存储和I/O效率革命性提升。

📝 摘要： 针对超长用户序列训练中“Fat Row”范式导致的存储和I/O瓶颈，Meta提出“版本化延迟物化”范式。该方法将用户交互历史归一化存储，训练时通过轻量级版本指针即时重建序列，从根本上消除了数据冗余。系统通过分叉协议保证在线-离线一致性，并设计了只读存储层支持多维度投影下推。该方案已在Meta生产环境部署，显著降低了训练数据基础设施资源消耗，并支撑了HSTU等前沿模型的大规模训练，是工业级超长序列训练的基础设施级创新。

3. The Attention Market: Interpreting Online Fair Re-ranking as Manifold Optimization under Walrasian Equilibrium

🔗 原文： https://arxiv.org/abs/2604.25577

🏷️ 来源： 🎓 学术界 | Renmin University of China, University of Montreal, University of Amsterdam

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 用市场均衡和流形优化统一公平重排序，方法新颖有效。

📝 摘要： 本文提出一个新颖视角，将公平重排序建模为“注意力市场”中的Walrasian均衡问题，并证明寻求该均衡等价于在特定排序流形上进行梯度下降。基于此，作者提出ManifoldRank算法，通过在供给侧和需求侧分别进行梯度调整，有效平衡公平性与准确性。实验在多个数据集和20种设置下评估，验证了其相比现有方法的优势。该工作为公平性推荐提供了坚实的理论框架，但作为纯学术研究，其在大规模系统上的可扩展性有待验证。

4. Harmonizing Generative Retrieval and Ranking in Chain-of-Recommendation

🔗 原文： https://arxiv.org/abs/2604.25787

🏷️ 来源： 🤝 产学合作 | NJUST, Kuaishou Technology

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 统一生成式检索与排序，弥合候选生成与排序gap。

📝 摘要： 针对生成式推荐中“候选生成”与“排序”之间的gap，本文提出RecoChain框架，在单一Transformer骨干中统一了检索和排序。推理时，模型首先生成候选物品，然后通过SIM（Similarity-based Interaction Module）进行排序，以估计点击概率。在大规模真实数据集上的实验表明，该方法有效弥合了生成与排序的鸿沟，在提升Top-K推荐性能的同时保持了强大的生成能力。该工作为构建端到端的生成式推荐系统提供了新思路。

5. Break the Inaccessible Boundary: Distilling Post-Conversion Content for User Retention Modeling

🔗 原文： https://arxiv.org/abs/2604.25839

🏷️ 来源： 🏭 工业界 | Kuaishou

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 蒸馏后转化内容提升留存预测，工业验证有效。

📝 摘要： 针对RTB广告系统中用户留存预测的“特征泄露”问题，本文提出OCARM两阶段蒸馏对齐框架。第一阶段，利用“后转化内容”训练教师模型；第二阶段，通过蒸馏让学生模型仅用可观测特征就能逼近教师表征。该方法巧妙地解决了训练与服务不一致的问题，离线实验和线上A/B测试均验证了其在真实增长场景中的有效性。对于从事广告留存建模的工程师，这是一个非常实用的解决方案。

6. Offline Evaluation Measures of Fairness in Recommender Systems

🔗 原文： https://arxiv.org/abs/2604.25032

🏷️ 来源： 🎓 学术界 | University of Copenhagen

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 系统分析推荐系统公平性离线评估度量的局限性并提出改进。

📝 摘要： 这篇博士论文系统性地审视了现有推荐系统公平性离线评估度量的理论、经验和概念局限性。作者分析了多种针对不同公平性概念（用户/物品、群体/个体）的度量，揭示了它们在可解释性、表达力和适用性上的缺陷，并提出了新的评估方法和度量来克服这些局限。最后，论文给出了度量选择指南。对于需要评估和落地公平性算法的团队，这篇工作提供了宝贵的“避坑指南”。

7. Personalized Multi-Interest Modeling for Cross-Domain Recommendation to Cold-Start Users

🔗 原文： https://arxiv.org/abs/2604.25732

🏷️ 来源： 🤝 产学合作 | Chinese Academy of Sciences, Kuaishou Technology, Griffith University

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 用神经过程+归一化流建模跨域多兴趣，缓解冷启动。

📝 摘要： 针对跨域推荐中忽略用户个性化偏好和多兴趣的问题，本文提出NF-NPCDR框架。该方法创新性地将神经过程与归一化流结合，将单峰高斯分布转换为多峰分布，以捕捉用户的个性化多兴趣。同时，通过偏好池捕获用户间的共性偏好，并设计随机自适应解码器进行融合。在公开数据集上的实验验证了其对冷启用户的有效性。该方法复杂度较高，且未与基于大模型的最新方法对比，但其多兴趣建模思路值得借鉴。