推荐算法日报 - 2026-06-19

全链路协同设计成为工业界新范式:Meta 的 RankGraph-2 和 Airbnb 的 JourneyFormer 都展示了从数据构建、模型训练到在线服务的端到端协同优化思路。RankGraph-2 更是明确提出图构建、训练、服务三阶段生命周期协同设计,通过各阶段需求相互约束来提升整体效率,这标志着工业界推荐系统正从单点优化走向全链路系统级优化。; 多语言/跨域检索成为热点,工业界与学术界共同发力:今日有多篇论文聚焦多语言或跨域场景。Baidu 的 Querit-Reranker 通过标签无

推荐算法日报 - 2026-06-18

大模型驱动的推荐系统范式升级:今日多篇论文聚焦于将大型语言模型(LLM)深度融入推荐系统,不再局限于特征工程,而是直接利用LLM进行用户行为序列建模、跨域知识迁移和冷启动物品理解。这表明业界正从“LLM辅助推荐”向“LLM原生推荐”演进,核心挑战在于如何平衡模型容量与推理效率。; 多模态与长序列建模的工程化突破:针对短视频、直播等富媒体场景,业界开始探索更高效的多模态特征融合与用户长期行为序列建模方案。例如,通过解耦注意力机制或记忆网络,在可控的计算成本下,将用户数月的交互历史纳入模型,以捕捉动

推荐算法日报 - 2026-06-17

生成式推荐与多任务架构的深度融合:今日多篇论文(OneRank、OneBar、HoloRec)不约而同地将生成式或Transformer-native架构引入推荐核心环节,从精排到召回,试图用统一的生成式框架替代传统的多阶段级联设计,解决目标碎片化和信息瓶颈问题。; 挖掘被忽视的信号源:负行为与合成先验:工业界正积极从“数据”本身寻找增量。一方面,Beyond Positive Signals 论文系统性地将用户隐式负行为(跳过、低参与度)纳入序列建模,以极低成本带来显著AUC提升;另一方面,S

推荐算法日报 - 2026-06-16

检索增强与自适应优化:今日多篇论文聚焦于优化RAG系统的检索环节,核心趋势是从“固定K值”转向“自适应”。无论是ScoreGate通过双分数统计融合动态决定检索数量,还是ADORE通过迭代检索-评估-扩展优化查询,亦或是TASR提出无需训练的停止规则,都旨在以最小的额外成本(零推理调用或轻量规则)提升检索效率与质量,这对工业级RAG系统降低延迟和成本极具价值。; 生成式推荐的时序与语义融合:以ChronoID为代表,生成式推荐正从“时间无关”的语义ID学习,转向显式注入时间信号。这揭示了现有方法

推荐周报 2026-W24

本周推荐系统研究围绕三条技术主线展开:生成式推荐从架构完备走向工业级工程落地,其中编辑性、长序列建模、物品级评分等关键能力被逐一攻克;LLM增强的推荐从离线推理迈向在线实时,谷歌与快手等团队实现了十亿用户规模的实时用户画像与意图推理;召回排序系统的成本与效率优化出现系统性方案,小红书以90%硬件成本节省为代价将聚类ANNS部署至SSD存储,同时CTR模型的残差路径设计开始突破缩放定律瓶颈。 主线1(生成式检索工程化): 快手推出的OneRetrieval首次实现了可编辑的生成式检索,在替换倒排索引分支后显著提升订单量与CTR;Yandex的Gryphon引入联合训练的物品级评分组件,替换超过15个候选生成器与粗排阶段,召回量Recall@1000提升3.7%;京东的AdaGRPO通过自适应门控GRPO损失,将HR@10从11.01%提升至12.18%;Meta的Beyond Item IDs提出Global-Aware Compression Transformer,将峰值内存降低一个数量级;阿里的SSRLive通过动态语义ID融入用户-主播交互信号,线上观看时长+3.38%。 主线2(LLM推荐实时化): 谷歌的LLM-Based User Personas框架实现了十亿用户规模的实时自然语言用户画像生成,结合知识蒸馏与异步推理在线上A/B测试中显著提升用户价值;快手的AIR通过离线生成原子意图、在线检索组合的方式实现了400倍推理加速,GMV+3.446%;DoorDash的Mind the Gap利用分层RAG从餐厅订单中生成多级分类特征,在零售品类上CTR+2.1%;OPPO的ToolRec为小布助手(1.5亿月活)构建了双层级点击校准机制,CTR显著提升。 主线3(召回排序系统效率优化): 小红书的Helmsman在40台SSD服务器上替代了原需35000核与0.35PB DRAM的HNSW集群,硬件成本节省90%;DeRes通过双路径残差架构在工业CTR数据集上AUC+0.32%,且计算-AUC缩放定律显示8层DeRes匹配16层OneTrans(2倍计算节省);Meta的DUET将用户行为分离为点击与转化两个流,分别用专用Transformer预训练,离线NE降低0.38%;eBay的Representation Curriculum通过分阶段训练缓解曝光依赖信号,冷启动Recall+5.2%。

推荐算法日报 - 2026-06-13

生成式检索从概念走向工业落地:今日两篇高分论文均聚焦于用生成式模型统一或替代传统多阶段召回。快手的 OneRetrieval 首次在电商搜索中实现可编辑的生成式检索,统一多分支召回并显著提升订单量。这表明生成式检索正从学术概念向解决工业级“可编辑性”和“大规模部署”等核心痛点演进。; 向量检索系统架构向成本效率倾斜:小红书的 Helmsman 系统挑战了内存图索引(HNSW)的主导地位,通过构建基于全闪存服务器的聚类ANNS,结合用户态存储栈和GPU加速,将硬件成本降低90%。这揭示了在数据规模

推荐算法日报 - 2026-06-12

LLM 深度融入推荐系统全链路:今日多篇论文展示了 LLM 不再仅是辅助工具,而是直接参与推荐核心环节。从 Google 的实时用户画像生成(召回/排序特征),到 CompRank 的 LLM 重排序,再到 TAA-k 优化 RAG 上下文选择,LLM 正在渗透召回、排序、重排等各个阶段,且开始关注工业级部署的效率和成本问题。; 生成式模型成为解决推荐顽疾的新范式:DiffCold 使用扩散模型解决冷启动中的“跷跷板困境”,通过生成式方法统一冷热物品的表示空间。这表明生成式模型(扩散模型、LLM

推荐算法日报 - 2026-06-11

LLM 的工业级落地:从"能不能用"到"怎么用好":今日多篇论文聚焦于将 LLM 的语义理解能力以低延迟、低成本的方式融入工业推荐系统。快手提出的 AIR 框架通过离线推理+在线检索组合实现 400 倍加速,是 LLM 在跨域推荐场景中成功落地的典型案例,证明了 LLM 在工业界不再是"空中楼阁"。; 长序列建模的"记忆革命":从压缩到解耦:针对长序列推荐中线性注意力导致的语义状态沉没问题,快手提出的 SinkRec 通过外部化记忆模块,将重复行为模式从状态中解耦出来,让模型专注于动态变化。这种

推荐算法日报 - 2026-06-10

生成式推荐进入精细化调优阶段:今日多篇论文聚焦于生成式推荐(GR)的落地痛点。从京东的AdaGRPO(自适应门控GRPO解决奖励模型噪声)到Yandex的Gryphon(统一SID生成与物品级评分解决序列似然与相关性目标不一致),再到山大的PRO(理论分析索引-解码间隙),业界正从“能否用GR”转向“如何让GR更鲁棒、更精准、更简化系统”。核心趋势是:在GR框架内引入更精细的控制机制(门控、评分、理论指导),而非推翻范式。; 长序列建模与语义化ID成为工业级推荐标配:Meta的论文展示了在十亿用

推荐算法日报 - 2026-06-09

生成式推荐进入深水区:动态语义ID成为核心战场 今日多篇论文(SSRLive、DREAM、CaLIR)聚焦于生成式推荐中的语义ID(SID)问题。业界共识已从“能否用SID做推荐”转向“如何让SID动态适应内容变化和冷启动”。SSRLive提出动态SID解决直播内容快速变化,DREAM通过三阶段框架解决冷启动SID分配,CaLIR则用类别引导的隐式意图推理弥补查询与SID的语义鸿沟。这表明生成式推荐正从静态范式向动态、自适应范式演进。; LLM+RAG成为跨域冷启动的标配方案 DoorDash的

推荐周报 2026-W23

本周推荐系统研究围绕三条技术主线展开。 主线1:生成式推荐从“能跑”走向““跑得稳”——语义ID与推理能力成为工业焦点。 Pinterest的UniPinRec实现了检索与排序的全栈统一(线上engagement +1%,延迟-11.1%),跳出了生成式推荐仅做检索的边界。快手的OneReason(线上部署)则揭示了思考模式在生成式推荐中无效的根本原因——感知与认知双因素缺失,并给出三级CoT格式和专化-统一训练的解决方案。两者的共同指向是:生成式推荐的核心瓶颈已从模型架构转移至数据形态(语义ID)与系统协同。 主线2:跨域冷启动从“搬特征”到“学迁移”——LLM作为跨域桥接器开始大规模落地。 快手的RGCD-Rep(服务4亿+用户)用MLLM推理蒸馏将短视频用户兴趣迁移至直播,冷启动参与度显著提升。Meta的Quantizing Intent论文(线上AUC +1.522%冷启)则将有机feed行为量化为语义ID注入广告排序,证明行为富集度决定跨域迁移质量。两篇的共同发现是:跨域迁移的关键不在对齐特征,而在构建可迁移的语义表征。 主线3:LLM/Agent增强推荐走向行业差异化——从通用检索到垂直场景的深度适配。 理想汽车的HPRO(132天A/B,销量+9.5%)将偏好优化引入销售线索评分,解决稀疏监督和漏斗层级问题。快手的Taiji(CTR +12.4%,收入+15.2%)提出帕累托最优策略优化,在语义与ID之间找到最优权衡点。Syft的DynaTree(生存率提升1.5倍)则用离线智能体建树+在线轻量子树选择解决时间敏感新闻检索的效率问题。这些工作表明,LLM在推荐中的应用正从“通用方案”走向“场景定制”。

推荐算法日报 - 2026-06-06

生成式推荐的推理能力觉醒:以快手 OneReason 为代表,工业界正将 LLM 的“先思考后回答”范式引入生成式推荐。核心挑战在于如何为纯 item token 序列构建有意义的 CoT,OneReason 通过强化 item token 的语义感知(Perception)和用户行为序列的认知重组(Cognition)来激活推理能力,首次在线上场景实现了思考模式优于非思考模式。; 冷启动问题的新解法:不对称结构与监督学习:本周两篇论文从不同角度切入冷启动。Tubi 提出不对称图架构(Shall