推荐算法日报 - 2026-06-06

生成式推荐的推理能力觉醒:以快手 OneReason 为代表,工业界正将 LLM 的“先思考后回答”范式引入生成式推荐。核心挑战在于如何为纯 item token 序列构建有意义的 CoT,OneReason 通过强化 item token 的语义感知(Perception)和用户行为序列的认知重组(Cognition)来激活推理能力,首次在线上场景实现了思考模式优于非思考模式。; 冷启动问题的新解法:不对称结构与监督学习:本周两篇论文从不同角度切入冷启动。Tubi 提出不对称图架构(Shall

推荐算法日报 - 2026-06-05

LLM 深度融入推荐全链路:今日论文显示,LLM 的应用已从简单的特征增强,深入到精排(HPRO)、召回(RGCD-Rep)、特征工程(DSIRM)等核心环节。方法上不再局限于文本生成,而是利用 LLM 的语义理解能力进行判别式排序、知识蒸馏和偏好建模,工业落地验证效果显著。; 跨域与冷启动问题的新解法:多篇论文聚焦于利用富域(如短视频)的丰富信号,通过可迁移表示学习(RGCD-Rep)或偏好对生成(HPRO)来缓解目标域(如直播、销售线索)的稀疏监督和冷启动问题。核心思路是借助 LLM/MLL

推荐算法日报 - 2026-06-04

LLM 增强推荐走向工业落地与精细化对齐:今日多篇论文聚焦 LLM 与推荐系统的深度融合,从概念验证迈向大规模工业部署。快手的 Taiji 框架直接部署于日活 4 亿+的广告平台,通过帕累托最优策略优化(POPO)解决了 LLM 语义空间与推荐 ID 空间的权衡问题。同时,腾讯的 R3 和中科院的 BAHSD 分别从 Agent 技能检索和黑盒蒸馏角度,探索了 LLM 在推荐系统不同环节的精细化应用,体现了业界对 LLM 落地可行性和收益的务实追求。; 序列推荐建模向多尺度、自适应与可解释性演进

推荐算法日报 - 2026-06-03

生成式推荐进入"全栈统一"与"表示优化"深水区:今日多篇论文(UniPinRec、PrefixMem、DRQ)聚焦于生成式推荐(Semantic ID)的工业化落地。趋势从"用LLM生成推荐"转向"如何高效、鲁棒地表示和利用Semantic ID",包括统一检索与排序的全栈架构(UniPinRec)、为SID设计专用编码器(PrefixMem)、以及解耦量化提升鲁棒性(DRQ)。这表明生成式推荐正从概念验证走向大规模系统部署,核心瓶颈已从"能否用"变为"如何用好"。; 跨域/跨模态信号迁移成为工

推荐算法日报 - 2026-06-02

Agent 驱动的检索与推理:今日多篇论文探索了 Agent 范式在推荐系统中的应用。DynaTree 利用多 Agent 协作构建离线检索树,实现高效的在线新闻检索;DCRC 则训练一个数据为中心的 Agent 来编译可执行的推理程序,以解决金融 QA 中的数值幻觉问题。这表明 Agent 正在从单纯的对话式交互,向更复杂的、结构化的离线规划与在线执行解耦的方向演进。; 从“模型为中心”到“数据/系统为中心”的范式转移:多篇论文不再单纯优化模型架构,而是从数据或系统层面寻求突破。V-SPLAD

推荐周报 2026-W22

本周推荐系统研究围绕三条技术主线展开。 工业级知识蒸馏进入迁移率量化时代: 字节跳动、Meta、微软、阿里分别展示了大规模蒸馏框架。字节的Rec-Distill(24B教师、20K序列)实现蒸馏迁移率>60%,阿里GPlan将LLM推理压缩为隐式token,Meta的LoopFM通过结构化中间表示让蒸馏迁移率翻倍,微软HARNESS-LM以190M参数恢复教师98%精度。四篇的共同指向是——蒸馏已经不只是模型压缩手段,而是把大模型能力“货币化”为可量化的业务指标。 生成式推荐从项目生成走向意图序列与条件生成: 阿里QGS在Quark搜索部署conditional next-item预测,Netflix揭示1B参数生成式推荐中不同任务的缩放天花板,清华SID碰撞分析发现Hit@10被高估103%。三篇共同说明——生成式推荐正在进入精细化评估和条件控制阶段。 推荐系统缩放从“堆参数”转向多维协同与测试时计算: Coupang系统研究CVR模型在骨干、嵌入、数据三个维度的可加缩放效应;阿里UTTSI首次将test-time compute引入CTR,无模型修改下CTR提升5.3%;Meta的rank-aware decomposition使DLRM吞吐量提升87.5%。缩放的核心矛盾已从“能不能大”变为“怎么用得巧”。

推荐算法日报 - 2026-05-30

大模型知识迁移与蒸馏成为工业界核心战场:今日多篇工业界论文(阿里GPlan、字节Rec-Distill、Meta LoopFM)聚焦于如何将大模型(LLM或Foundation Model)的推理能力或表征知识高效迁移至轻量级服务模型。核心创新点从传统的标量蒸馏转向结构化知识(如隐式推理token、中间层嵌入、历史表示)的传递,旨在突破知识迁移率瓶颈,实现线上部署的精度与延迟平衡。; 推荐系统进入“生成式”与“规划”时代:以阿里GPlan为代表,推荐任务正从“预测下一个点击”向“生成并规划一个意

推荐算法日报 - 2026-05-29

LLM 从辅助信号走向核心排序引擎:今日多篇论文(MixRAGRec, LRanker, DoorDash)展示了 LLM 从离线生成标签、辅助特征,到直接参与召回和精排的演进。核心挑战在于如何在大规模候选集和低延迟约束下,高效利用 LLM 的语义理解能力,而非简单替换现有模型。; 推理优化成为工业落地关键:Meta 的秩感知分解和 Pinterest 的 LLM 辅助预测器,都指向一个共同目标——在不牺牲效果的前提下,大幅降低计算成本。这表明,当学术界在探索 LLM 的潜力时,工业界更关注如何

推荐算法日报 - 2026-05-28

LLM 深度融入推荐全链路:今日多篇论文(MuChator、L2Rec)展示了 LLM 不再仅是特征提取器,而是作为核心推理引擎,通过预训练注入领域知识、指令微调对齐用户意图、强化学习对齐偏好,直接参与召回与排序决策。工业界已验证其线上效果,LLM for Rec 正从实验走向大规模部署。; 两阶段排序的端到端训练突破:CA-PG 论文针对两阶段排序中早期排序器(ESR)难以端到端训练的痛点,提出信用分配策略梯度,有效降低训练方差并加速收敛。这为工业界优化全链路(召回+排序)提供了新的理论工具,

推荐算法日报 - 2026-05-27

生成式推荐与检索增强的工业落地:今日多篇论文(QGS、DeGRe、Memento)将生成式序列模型或RAG范式应用于搜索排序、重排和长历史建模。核心趋势是从“全量序列建模”转向“条件生成”或“检索增强”,通过显式引入查询条件(QGS)、离线探索在线蒸馏(DeGRe)或MMR多样性检索(Memento),在保持生成式模型优势的同时,解决查询切换噪声、序列探索效率及长历史注意力稀释等工业级痛点,且均有线上效果验证。; 多模态与终身兴趣建模的统一框架:SIREN 提出了统一多粒度语义交互框架,通过软/

推荐算法日报 - 2026-05-26

生成式推荐进入工业深水区:今日多篇论文(Netflix、Tubi)展示了生成式推荐从概念验证到大规模部署的实践。核心挑战不再是模型能力,而是生产约束:任务头空间(task headroom)、重复训练成本、服务延迟对齐、冷启动泛化。Netflix 提出 offset scaling-law 诊断来判断扩展收益,Tubi 则用“用户故事”序列化统一多任务。这标志着生成式推荐正从“能不能做”转向“如何高效落地”。; 知识蒸馏与模型压缩成为工业部署标配:Microsoft 的 HARNESS-LM 和

推荐周报 2026-W21

本周推荐系统研究围绕三条技术主线展开:生成式推荐从“验证可行性”走向“工业级部署与优化”,去偏与校准技术从单一方法走向融合框架,搜索召回系统在冷启动和异构加速上取得具体突破。 生成式推荐进入工业化深水区: 快手、腾讯、美团的四篇部署论文覆盖了推理增强(RPORec)、长兴趣建模(GenLI)、世界知识融合(LWGR)等核心痛点。共同的指向是——生成式推荐的核心问题已从“能不能用”转变为“如何稳定、可控地替换或增强传统pipeline”。 去偏与校准从“纠正均值”走向“治理分布”: 字节跳动的PEARL、快手的DADF、Pinterest的PRL-PUTS分别从对比百分位、残差校正、效用权重调优三个角度,给出了生产级解决方案。其中PEARL的Watch Duration +2.10%和DADF的时间花费+0.347%表明,分布级别偏差校正仍有显著收益空间。 搜索召回系统聚焦冷启动与系统效率: 淘宝的GrowthGR(新商品GMV+5.3%)和Airbnb的合成数据框架(查询长度KL散度降至0.66)展示了LLM+反事实推断在冷启动中的工程潜力。华为与京东合作的Ascend-RaBitQ将billion-scale向量搜索的NPU加速提升至4.6倍,为大规模召回提供了硬件-算法协同的新基准。