推荐算法日报 - 2026-06-10

生成式推荐进入精细化调优阶段:今日多篇论文聚焦于生成式推荐(GR)的落地痛点。从京东的AdaGRPO(自适应门控GRPO解决奖励模型噪声)到Yandex的Gryphon(统一SID生成与物品级评分解决序列似然与相关性目标不一致),再到山大的PRO(理论分析索引-解码间隙),业界正从“能否用GR”转向“如何让GR更鲁棒、更精准、更简化系统”。核心趋势是:在GR框架内引入更精细的控制机制(门控、评分、理论指导),而非推翻范式。; 长序列建模与语义化ID成为工业级推荐标配:Meta的论文展示了在十亿用

推荐算法日报 - 2026-06-09

生成式推荐进入深水区:动态语义ID成为核心战场 今日多篇论文(SSRLive、DREAM、CaLIR)聚焦于生成式推荐中的语义ID(SID)问题。业界共识已从“能否用SID做推荐”转向“如何让SID动态适应内容变化和冷启动”。SSRLive提出动态SID解决直播内容快速变化,DREAM通过三阶段框架解决冷启动SID分配,CaLIR则用类别引导的隐式意图推理弥补查询与SID的语义鸿沟。这表明生成式推荐正从静态范式向动态、自适应范式演进。; LLM+RAG成为跨域冷启动的标配方案 DoorDash的

推荐周报 2026-W23

本周推荐系统研究围绕三条技术主线展开。 主线1:生成式推荐从“能跑”走向““跑得稳”——语义ID与推理能力成为工业焦点。 Pinterest的UniPinRec实现了检索与排序的全栈统一(线上engagement +1%,延迟-11.1%),跳出了生成式推荐仅做检索的边界。快手的OneReason(线上部署)则揭示了思考模式在生成式推荐中无效的根本原因——感知与认知双因素缺失,并给出三级CoT格式和专化-统一训练的解决方案。两者的共同指向是:生成式推荐的核心瓶颈已从模型架构转移至数据形态(语义ID)与系统协同。 主线2:跨域冷启动从“搬特征”到“学迁移”——LLM作为跨域桥接器开始大规模落地。 快手的RGCD-Rep(服务4亿+用户)用MLLM推理蒸馏将短视频用户兴趣迁移至直播,冷启动参与度显著提升。Meta的Quantizing Intent论文(线上AUC +1.522%冷启)则将有机feed行为量化为语义ID注入广告排序,证明行为富集度决定跨域迁移质量。两篇的共同发现是:跨域迁移的关键不在对齐特征,而在构建可迁移的语义表征。 主线3:LLM/Agent增强推荐走向行业差异化——从通用检索到垂直场景的深度适配。 理想汽车的HPRO(132天A/B,销量+9.5%)将偏好优化引入销售线索评分,解决稀疏监督和漏斗层级问题。快手的Taiji(CTR +12.4%,收入+15.2%)提出帕累托最优策略优化,在语义与ID之间找到最优权衡点。Syft的DynaTree(生存率提升1.5倍)则用离线智能体建树+在线轻量子树选择解决时间敏感新闻检索的效率问题。这些工作表明,LLM在推荐中的应用正从“通用方案”走向“场景定制”。

推荐算法日报 - 2026-06-06

生成式推荐的推理能力觉醒:以快手 OneReason 为代表,工业界正将 LLM 的“先思考后回答”范式引入生成式推荐。核心挑战在于如何为纯 item token 序列构建有意义的 CoT,OneReason 通过强化 item token 的语义感知(Perception)和用户行为序列的认知重组(Cognition)来激活推理能力,首次在线上场景实现了思考模式优于非思考模式。; 冷启动问题的新解法:不对称结构与监督学习:本周两篇论文从不同角度切入冷启动。Tubi 提出不对称图架构(Shall

推荐算法日报 - 2026-06-05

LLM 深度融入推荐全链路:今日论文显示,LLM 的应用已从简单的特征增强,深入到精排(HPRO)、召回(RGCD-Rep)、特征工程(DSIRM)等核心环节。方法上不再局限于文本生成,而是利用 LLM 的语义理解能力进行判别式排序、知识蒸馏和偏好建模,工业落地验证效果显著。; 跨域与冷启动问题的新解法:多篇论文聚焦于利用富域(如短视频)的丰富信号,通过可迁移表示学习(RGCD-Rep)或偏好对生成(HPRO)来缓解目标域(如直播、销售线索)的稀疏监督和冷启动问题。核心思路是借助 LLM/MLL

推荐算法日报 - 2026-06-04

LLM 增强推荐走向工业落地与精细化对齐:今日多篇论文聚焦 LLM 与推荐系统的深度融合,从概念验证迈向大规模工业部署。快手的 Taiji 框架直接部署于日活 4 亿+的广告平台,通过帕累托最优策略优化(POPO)解决了 LLM 语义空间与推荐 ID 空间的权衡问题。同时,腾讯的 R3 和中科院的 BAHSD 分别从 Agent 技能检索和黑盒蒸馏角度,探索了 LLM 在推荐系统不同环节的精细化应用,体现了业界对 LLM 落地可行性和收益的务实追求。; 序列推荐建模向多尺度、自适应与可解释性演进

推荐算法日报 - 2026-06-03

生成式推荐进入"全栈统一"与"表示优化"深水区:今日多篇论文(UniPinRec、PrefixMem、DRQ)聚焦于生成式推荐(Semantic ID)的工业化落地。趋势从"用LLM生成推荐"转向"如何高效、鲁棒地表示和利用Semantic ID",包括统一检索与排序的全栈架构(UniPinRec)、为SID设计专用编码器(PrefixMem)、以及解耦量化提升鲁棒性(DRQ)。这表明生成式推荐正从概念验证走向大规模系统部署,核心瓶颈已从"能否用"变为"如何用好"。; 跨域/跨模态信号迁移成为工

推荐算法日报 - 2026-06-02

Agent 驱动的检索与推理:今日多篇论文探索了 Agent 范式在推荐系统中的应用。DynaTree 利用多 Agent 协作构建离线检索树,实现高效的在线新闻检索;DCRC 则训练一个数据为中心的 Agent 来编译可执行的推理程序,以解决金融 QA 中的数值幻觉问题。这表明 Agent 正在从单纯的对话式交互,向更复杂的、结构化的离线规划与在线执行解耦的方向演进。; 从“模型为中心”到“数据/系统为中心”的范式转移:多篇论文不再单纯优化模型架构,而是从数据或系统层面寻求突破。V-SPLAD

推荐周报 2026-W22

本周推荐系统研究围绕三条技术主线展开。 工业级知识蒸馏进入迁移率量化时代: 字节跳动、Meta、微软、阿里分别展示了大规模蒸馏框架。字节的Rec-Distill(24B教师、20K序列)实现蒸馏迁移率>60%,阿里GPlan将LLM推理压缩为隐式token,Meta的LoopFM通过结构化中间表示让蒸馏迁移率翻倍,微软HARNESS-LM以190M参数恢复教师98%精度。四篇的共同指向是——蒸馏已经不只是模型压缩手段,而是把大模型能力“货币化”为可量化的业务指标。 生成式推荐从项目生成走向意图序列与条件生成: 阿里QGS在Quark搜索部署conditional next-item预测,Netflix揭示1B参数生成式推荐中不同任务的缩放天花板,清华SID碰撞分析发现Hit@10被高估103%。三篇共同说明——生成式推荐正在进入精细化评估和条件控制阶段。 推荐系统缩放从“堆参数”转向多维协同与测试时计算: Coupang系统研究CVR模型在骨干、嵌入、数据三个维度的可加缩放效应;阿里UTTSI首次将test-time compute引入CTR,无模型修改下CTR提升5.3%;Meta的rank-aware decomposition使DLRM吞吐量提升87.5%。缩放的核心矛盾已从“能不能大”变为“怎么用得巧”。

推荐算法日报 - 2026-05-30

大模型知识迁移与蒸馏成为工业界核心战场:今日多篇工业界论文(阿里GPlan、字节Rec-Distill、Meta LoopFM)聚焦于如何将大模型(LLM或Foundation Model)的推理能力或表征知识高效迁移至轻量级服务模型。核心创新点从传统的标量蒸馏转向结构化知识(如隐式推理token、中间层嵌入、历史表示)的传递,旨在突破知识迁移率瓶颈,实现线上部署的精度与延迟平衡。; 推荐系统进入“生成式”与“规划”时代:以阿里GPlan为代表,推荐任务正从“预测下一个点击”向“生成并规划一个意

推荐算法日报 - 2026-05-29

LLM 从辅助信号走向核心排序引擎:今日多篇论文(MixRAGRec, LRanker, DoorDash)展示了 LLM 从离线生成标签、辅助特征,到直接参与召回和精排的演进。核心挑战在于如何在大规模候选集和低延迟约束下,高效利用 LLM 的语义理解能力,而非简单替换现有模型。; 推理优化成为工业落地关键:Meta 的秩感知分解和 Pinterest 的 LLM 辅助预测器,都指向一个共同目标——在不牺牲效果的前提下,大幅降低计算成本。这表明,当学术界在探索 LLM 的潜力时,工业界更关注如何

推荐算法日报 - 2026-05-28

LLM 深度融入推荐全链路:今日多篇论文(MuChator、L2Rec)展示了 LLM 不再仅是特征提取器,而是作为核心推理引擎,通过预训练注入领域知识、指令微调对齐用户意图、强化学习对齐偏好,直接参与召回与排序决策。工业界已验证其线上效果,LLM for Rec 正从实验走向大规模部署。; 两阶段排序的端到端训练突破:CA-PG 论文针对两阶段排序中早期排序器(ESR)难以端到端训练的痛点,提出信用分配策略梯度,有效降低训练方差并加速收敛。这为工业界优化全链路(召回+排序)提供了新的理论工具,