本周推荐系统研究围绕三条技术主线展开:生成式推荐从“验证可行性”走向“工业级部署与优化”,去偏与校准技术从单一方法走向融合框架,搜索召回系统在冷启动和异构加速上取得具体突破。 生成式推荐进入工业化深水区: 快手、腾讯、美团的四篇部署论文覆盖了推理增强(RPORec)、长兴趣建模(GenLI)、世界知识融合(LWGR)等核心痛点。共同的指向是——生成式推荐的核心问题已从“能不能用”转变为“如何稳定、可控地替换或增强传统pipeline”。 去偏与校准从“纠正均值”走向“治理分布”: 字节跳动的PEARL、快手的DADF、Pinterest的PRL-PUTS分别从对比百分位、残差校正、效用权重调优三个角度,给出了生产级解决方案。其中PEARL的Watch Duration +2.10%和DADF的时间花费+0.347%表明,分布级别偏差校正仍有显著收益空间。 搜索召回系统聚焦冷启动与系统效率: 淘宝的GrowthGR(新商品GMV+5.3%)和Airbnb的合成数据框架(查询长度KL散度降至0.66)展示了LLM+反事实推断在冷启动中的工程潜力。华为与京东合作的Ascend-RaBitQ将billion-scale向量搜索的NPU加速提升至4.6倍,为大规模召回提供了硬件-算法协同的新基准。
本周推荐系统研究围绕三条技术主线展开:生成式推荐架构从tokenizer优化走向推理效率提升,LLM增强推荐从孤立的辅助模块演化为具备记忆与推理能力的智能体,系统工程层的量化与线程编排成为工业部署的实际瓶颈突破点。 主线 1“生成式推荐的解耦与加速”: 阿里在TmallAPP上线 CQ-SID / EG-GRPO,以类别感知语义ID和专家引导强化学习实现GMV +1.15%,生成召回贡献72.63%购买。Tencent与清华的 AsymRec 提出非对称连续-离散框架,用多专家投影替代对称量化,平均提升15.8%。美团的 DIG 将tokenizer嵌入判别式排序模型端到端训练,同时提升检索与排序。Snap的 SID-MLP 用MLP蒸馏替代Transformer解码器,加速8.74倍且精度持平。这些工作的共同指向是——生成式推荐正在从“能跑”向“跑得稳、跑得快”过渡,核心手段是解耦输入输出表示与替换密度过高的结构。 主线 2“LLM推荐向推理与记忆演进”: Microsoft Research的 PGR 引入前瞻引导检索,用Tree-of-Thought扩展查询步骤,在MemoryQuest上召回提升近3倍。美团的 RecRM-Bench 提供了100万条结构化条目覆盖指令遵循、事实一致性等四维奖励,为智能体推荐系统提供基础。SDAR(美团)用门控辅助目标稳定OPSD蒸馏,在ALFWorld、Search-QA等基准上相对GRPO提升7-10%。差异在于——PGR侧重检索前的前瞻推理,SDAR侧重训练中的稳定性,但共同挑战是LLM在推荐场景中的记忆与推理能力仍远未成熟。 主线 3“系统协同设计成为工业落地关键”: Meta的 LoKA 通过Probe-Mods-Dispatch三件套在FP8下实现训练吞吐+20%、推理加速+40%且无质量损失。Xiaohongshu的 CCD-Level Thread Orchestration 利用CCD架构的缓存特性,在ANNS服务上取得3.7x吞吐提升和30-90% P999延迟降低。Baidu的 Efficient Generative Targeting 结合量化、稀疏化和并行验证,实现1.8倍推理加速并部署于广告系统。这些工作表明——模型架构改进的边际效应递减时,硬件感知的系统优化正成为实际收益的主要来源。