推荐系统

日报

生成式推荐的推理能力觉醒：以快手 OneReason 为代表，工业界正将 LLM 的“先思考后回答”范式引入生成式推荐。核心挑战在于如何为纯 item token 序列构建有意义的 CoT，OneReason 通过强化 item token 的语义感知（Perception）和用户行为序列的认知重组（Cognition）来激活推理能力，首次在线上场景实现了思考模式优于非思考模式。; 冷启动问题的新解法：不对称结构与监督学习：本周两篇论文从不同角度切入冷启动。Tubi 提出不对称图架构（Shall

文章详情

推荐系统

日报

LLM 深度融入推荐全链路：今日论文显示，LLM 的应用已从简单的特征增强，深入到精排（HPRO）、召回（RGCD-Rep）、特征工程（DSIRM）等核心环节。方法上不再局限于文本生成，而是利用 LLM 的语义理解能力进行判别式排序、知识蒸馏和偏好建模，工业落地验证效果显著。; 跨域与冷启动问题的新解法：多篇论文聚焦于利用富域（如短视频）的丰富信号，通过可迁移表示学习（RGCD-Rep）或偏好对生成（HPRO）来缓解目标域（如直播、销售线索）的稀疏监督和冷启动问题。核心思路是借助 LLM/MLL

文章详情

推荐系统

日报

LLM 增强推荐走向工业落地与精细化对齐：今日多篇论文聚焦 LLM 与推荐系统的深度融合，从概念验证迈向大规模工业部署。快手的 Taiji 框架直接部署于日活 4 亿+的广告平台，通过帕累托最优策略优化（POPO）解决了 LLM 语义空间与推荐 ID 空间的权衡问题。同时，腾讯的 R3 和中科院的 BAHSD 分别从 Agent 技能检索和黑盒蒸馏角度，探索了 LLM 在推荐系统不同环节的精细化应用，体现了业界对 LLM 落地可行性和收益的务实追求。; 序列推荐建模向多尺度、自适应与可解释性演进

文章详情

推荐系统

日报

生成式推荐进入"全栈统一"与"表示优化"深水区：今日多篇论文（UniPinRec、PrefixMem、DRQ）聚焦于生成式推荐（Semantic ID）的工业化落地。趋势从"用LLM生成推荐"转向"如何高效、鲁棒地表示和利用Semantic ID"，包括统一检索与排序的全栈架构（UniPinRec）、为SID设计专用编码器（PrefixMem）、以及解耦量化提升鲁棒性（DRQ）。这表明生成式推荐正从概念验证走向大规模系统部署，核心瓶颈已从"能否用"变为"如何用好"。; 跨域/跨模态信号迁移成为工

文章详情

推荐系统

日报

Agent 驱动的检索与推理：今日多篇论文探索了 Agent 范式在推荐系统中的应用。DynaTree 利用多 Agent 协作构建离线检索树，实现高效的在线新闻检索；DCRC 则训练一个数据为中心的 Agent 来编译可执行的推理程序，以解决金融 QA 中的数值幻觉问题。这表明 Agent 正在从单纯的对话式交互，向更复杂的、结构化的离线规划与在线执行解耦的方向演进。; 从“模型为中心”到“数据/系统为中心”的范式转移：多篇论文不再单纯优化模型架构，而是从数据或系统层面寻求突破。V-SPLAD

本周推荐系统研究围绕三条技术主线展开。工业级知识蒸馏进入迁移率量化时代：字节跳动、Meta、微软、阿里分别展示了大规模蒸馏框架。字节的Rec-Distill（24B教师、20K序列）实现蒸馏迁移率>60%，阿里GPlan将LLM推理压缩为隐式token，Meta的LoopFM通过结构化中间表示让蒸馏迁移率翻倍，微软HARNESS-LM以190M参数恢复教师98%精度。四篇的共同指向是——蒸馏已经不只是模型压缩手段，而是把大模型能力“货币化”为可量化的业务指标。生成式推荐从项目生成走向意图序列与条件生成：阿里QGS在Quark搜索部署conditional next-item预测，Netflix揭示1B参数生成式推荐中不同任务的缩放天花板，清华SID碰撞分析发现Hit@10被高估103%。三篇共同说明——生成式推荐正在进入精细化评估和条件控制阶段。推荐系统缩放从“堆参数”转向多维协同与测试时计算： Coupang系统研究CVR模型在骨干、嵌入、数据三个维度的可加缩放效应；阿里UTTSI首次将test-time compute引入CTR，无模型修改下CTR提升5.3%；Meta的rank-aware decomposition使DLRM吞吐量提升87.5%。缩放的核心矛盾已从“能不能大”变为“怎么用得巧”。

文章详情

推荐系统

日报

大模型知识迁移与蒸馏成为工业界核心战场：今日多篇工业界论文（阿里GPlan、字节Rec-Distill、Meta LoopFM）聚焦于如何将大模型（LLM或Foundation Model）的推理能力或表征知识高效迁移至轻量级服务模型。核心创新点从传统的标量蒸馏转向结构化知识（如隐式推理token、中间层嵌入、历史表示）的传递，旨在突破知识迁移率瓶颈，实现线上部署的精度与延迟平衡。; 推荐系统进入“生成式”与“规划”时代：以阿里GPlan为代表，推荐任务正从“预测下一个点击”向“生成并规划一个意

文章详情

推荐系统

日报

LLM 从辅助信号走向核心排序引擎：今日多篇论文（MixRAGRec, LRanker, DoorDash）展示了 LLM 从离线生成标签、辅助特征，到直接参与召回和精排的演进。核心挑战在于如何在大规模候选集和低延迟约束下，高效利用 LLM 的语义理解能力，而非简单替换现有模型。; 推理优化成为工业落地关键：Meta 的秩感知分解和 Pinterest 的 LLM 辅助预测器，都指向一个共同目标——在不牺牲效果的前提下，大幅降低计算成本。这表明，当学术界在探索 LLM 的潜力时，工业界更关注如何

文章详情

推荐系统

日报

LLM 深度融入推荐全链路：今日多篇论文（MuChator、L2Rec）展示了 LLM 不再仅是特征提取器，而是作为核心推理引擎，通过预训练注入领域知识、指令微调对齐用户意图、强化学习对齐偏好，直接参与召回与排序决策。工业界已验证其线上效果，LLM for Rec 正从实验走向大规模部署。; 两阶段排序的端到端训练突破：CA-PG 论文针对两阶段排序中早期排序器（ESR）难以端到端训练的痛点，提出信用分配策略梯度，有效降低训练方差并加速收敛。这为工业界优化全链路（召回+排序）提供了新的理论工具，

文章详情

推荐系统

日报

生成式推荐与检索增强的工业落地：今日多篇论文（QGS、DeGRe、Memento）将生成式序列模型或RAG范式应用于搜索排序、重排和长历史建模。核心趋势是从“全量序列建模”转向“条件生成”或“检索增强”，通过显式引入查询条件（QGS）、离线探索在线蒸馏（DeGRe）或MMR多样性检索（Memento），在保持生成式模型优势的同时，解决查询切换噪声、序列探索效率及长历史注意力稀释等工业级痛点，且均有线上效果验证。; 多模态与终身兴趣建模的统一框架：SIREN 提出了统一多粒度语义交互框架，通过软/

文章详情

推荐系统

日报

生成式推荐进入工业深水区：今日多篇论文（Netflix、Tubi）展示了生成式推荐从概念验证到大规模部署的实践。核心挑战不再是模型能力，而是生产约束：任务头空间（task headroom）、重复训练成本、服务延迟对齐、冷启动泛化。Netflix 提出 offset scaling-law 诊断来判断扩展收益，Tubi 则用“用户故事”序列化统一多任务。这标志着生成式推荐正从“能不能做”转向“如何高效落地”。; 知识蒸馏与模型压缩成为工业部署标配：Microsoft 的 HARNESS-LM 和

本周推荐系统研究围绕三条技术主线展开：生成式推荐从“验证可行性”走向“工业级部署与优化”，去偏与校准技术从单一方法走向融合框架，搜索召回系统在冷启动和异构加速上取得具体突破。生成式推荐进入工业化深水区：快手、腾讯、美团的四篇部署论文覆盖了推理增强（RPORec）、长兴趣建模（GenLI）、世界知识融合（LWGR）等核心痛点。共同的指向是——生成式推荐的核心问题已从“能不能用”转变为“如何稳定、可控地替换或增强传统pipeline”。去偏与校准从“纠正均值”走向“治理分布”：字节跳动的PEARL、快手的DADF、Pinterest的PRL-PUTS分别从对比百分位、残差校正、效用权重调优三个角度，给出了生产级解决方案。其中PEARL的Watch Duration +2.10%和DADF的时间花费+0.347%表明，分布级别偏差校正仍有显著收益空间。搜索召回系统聚焦冷启动与系统效率：淘宝的GrowthGR（新商品GMV+5.3%）和Airbnb的合成数据框架（查询长度KL散度降至0.66）展示了LLM+反事实推断在冷启动中的工程潜力。华为与京东合作的Ascend-RaBitQ将billion-scale向量搜索的NPU加速提升至4.6倍，为大规模召回提供了硬件-算法协同的新基准。

文章详情

1 2 3 4 5 6

...