推荐周报 2026-W14

本周推荐系统研究围绕三条技术主线展开:生成式推荐的工程落地、Agent 驱动的系统自进化、以及排序模型的高效 scaling。 生成式推荐从"能跑"走向"跑得稳"。 阿里巴巴的 RCLRec 用反向课程学习解决转化信号的极端稀疏问题,线上广告收入 +2.09%;复旦的 DACT 提出 tokenizer 持续更新框架,应对数据分布漂移下的标识符失效。两篇论文的共同指向是——生成式推荐的瓶颈已经不在架构设计,而在工业环境下的持续运行。 阿里巴巴同期发布两篇 Agent 推荐系统论文——AutoModel 给工程蓝图,AgenticRS 给理论框架。 阿里巴巴系统性地探索了将 Agent 范式引入推荐系统全生命周期管理,agent 的角色从"模拟用户"转变为"替代工程师"。不过两篇论文目前都缺乏线上实验数据,能否跑通自动迭代闭环尚待验证。 排序模型的 scaling 竞赛继续加速。 快手的 UniMixer 将 attention、TokenMixer、FM 三类架构统一到一个参数化框架,在同等计算预算下 AUC 优于 RankMixer;Google 的零样本跨域知识蒸馏从 YouTube 迁移知识到 YouTube Music,线上 watch time +1.2%,为低流量场景提供了低成本能力迁移路径。

推荐算法日报 - 2026-04-05

📭 今日无新论文:根据提供的数据,今日(2026-04-05)没有新的精选论文收录。趋势分析将基于近期普遍关注的技术方向进行简要回顾。; 近期持续热点:工业界推荐系统的核心挑战仍集中在多目标优化、大规模检索效率、序列建模与长短期兴趣融合以及利用大语言模型(LLM)增强推荐理解与生成能力等方面。; 实践导向研究:高质量的论文通常具备清晰的问题定义、可复现的技术方案以及(对于工业界论文)线上AB实验验证,这些是评估其价值的关键。

推荐算法日报 - 2026-04-04

检索技术的精细化与显式化:今日论文显示,检索(包括查询改写和向量召回)技术正从“黑盒”走向“显式”和“可控”。无论是通过构建显式改写模式库来引导LLM生成(ReFormeR),还是设计感知数据异质性的度量与索引框架来提升混合检索的鲁棒性(STABLE),都强调了对检索过程的可解释性和可控性的追求,以应对复杂、异构的真实数据。; 后处理校正的演进:在模型排序后,通过轻量级后处理模块进行精细化校正,正成为解决特定偏差(如长尾问题)的有效手段。REPAIR框架通过残差分解,自适应地结合类间和成对校正,

推荐算法日报 - 2026-04-03

推荐系统架构的统一与高效化:工业界正致力于将不同范式的推荐模型(如基于注意力、TokenMixer、因子分解机)整合到统一的理论框架中,以提升模型缩放效率。同时,通过设计轻量级模块(如UniMixing-Lite)来优化参数量和计算成本,追求更高的ROI。; 个性化偏差校正成为新焦点:针对推荐系统中长期存在的流行度偏差问题,研究正从全局去偏转向更精细的个性化校准。通过量化用户个人偏好与推荐结果之间的对齐度,并在推理时进行动态调整,旨在实现更精准的偏好匹配,而非简单地抑制流行度。; 🤖 Agen

推荐算法日报 - 2026-04-02

生成式推荐的工程化探索:今日多篇论文聚焦生成式推荐(GRM)的落地挑战,从tokenizer的持续学习(DACT)、冷启动场景的系统性评估,到利用DPO进行偏好对齐(RoDPO),显示出学术界正从理论模型转向解决实际部署中的稳定性、适应性和效率问题。; 跨域/跨模态的知识迁移与对齐:工业界和学术界都在探索如何高效利用已有知识。Google通过零样本跨域蒸馏将视频推荐知识迁移至音乐推荐;阿里通过指令微调和RLHF实现多模态重排的领域自适应;微软则从理论上分析了单向量嵌入在跨域检索中的根本局限,均体

推荐算法日报 - 2026-04-01

RAG技术进入效率与结构优化深水区:今日多篇论文聚焦于检索增强生成(RAG)系统的核心瓶颈。研究重点从简单的分块检索转向更精细的结构化表示(如M-RAG的k-v元标记)和高效索引结构(如Bridge-RAG的抽象桥接树与Cuckoo Filter),旨在同时解决信息碎片化、检索噪声和计算效率问题,标志着RAG技术正从粗放走向精密。; 推荐系统评估从“追高指标”转向“探明上限”:学术界开始关注推荐系统性能的“天花板”问题。通过基于熵的无训练方法量化序列推荐的准确率上限,为工业界提供了模型无关的评估

推荐周报 2026-W13

本周推荐系统研究围绕三条主线展开。第一条是 Semantic ID 生成式推荐从范式验证进入工程深水区——冷启动信号平衡、广告变现兼容、分布外鲁棒性、推理能力注入,五篇论文分别攻克不同的落地痛点,其中阿里巴巴 OneSearch-V2 线上取得 CTR +3.98%、转化率 +3.05% 的实效。第二条是 LLM Agent 在推荐和搜索中的角色正在从"端到端替代"走向"分层协作"——推理归 LLM,执行归确定性模块,训练用强化学习对齐中间步骤与最终目标。第三条是工业搜索排序系统的效率战——淘宝 KARMA 用语义正则化解决 LLM 微调中的知识退化,UniScale 论证数据与模型必须协同扩展,DIET 将训练数据压缩至 1-2% 仍保持性能趋势一致。 本周共收录 16 篇论文。KARMA 是本周最值得关注的工业论文,覆盖淘宝搜索全链路(召回/粗排/精排)并完成线上部署验证。工业界贡献集中在阿里巴巴搜索体系,学术界则在 LLM Agent 与生成式推荐两个方向持续推进。

推荐算法日报 - 2026-03-31

从静态管道到动态智能体系统:今日论文均指向一个核心趋势:工业界正积极探索将传统的、静态的推荐系统模块(召回/排序/重排)重构为具有自我进化能力的智能体(Agent)。这旨在解决人工迭代成本高、难以应对复杂多目标业务约束的痛点,实现系统的自动化、智能化演进。; LLM与强化学习驱动系统自进化:为实现智能体的自我进化,论文提出了两种关键技术路径:一是利用强化学习在定义良好的动作空间中进行优化;二是利用大语言模型(LLM)在开放的设计空间中生成和选择新的模型架构与训练方案,为系统创新提供了新的可能性。

推荐算法日报 - 2026-03-29

📭 今日无更新:今日未收录新的精选论文,暂无趋势分析。

推荐算法日报 - 2026-03-28

训练效率与成本优化:今日多篇论文聚焦于推荐系统开发中的效率瓶颈。从快手提出的持续数据集蒸馏(DIET)到针对LSR模型的GPU内核优化(Sparton),再到用线性复杂度算子(Hyena)替代注意力机制,核心目标都是降低大规模数据训练和迭代的算力与时间成本,这是工业界持续关注的核心痛点。; 稀疏与冷启动场景的表示学习:在数据稀疏的特定场景(如在线健康社区)和复杂的多行为推荐中,如何学习更鲁棒、更可解释的用户/物品表示是关键。今日论文通过引入伪标签辅助目标、因果干预与对比学习对齐等方法,旨在利用有

推荐算法日报 - 2026-03-27

工业界聚焦数据与架构协同设计:今日多篇工业界论文(快手、阿里、Meta)均强调,单纯扩大模型参数已进入收益递减阶段。核心创新转向数据与模型的协同优化,例如通过扩展训练信号(ES³)、挖掘潜在意图(OneSearch-V2)或设计更高效的架构(HHSFT)来突破性能瓶颈。; LLM推荐走向深度优化与对齐:LLM在推荐中的应用正从简单微调转向更精细的优化。研究重点包括:通过自蒸馏或强化学习对齐LLM与推荐目标(OneSearch-V2, SumRank),设计轻量级适配器以平衡性能与公平性(Ligh