- 标签:
- 日报 (138)
- 技术趋势 (91)
- AI (86)
- 推荐系统 (81)
- 周报 (20)
- 论文 (13)
- 思考 (7)
- Agentic Engineering (6)
- 工具 (4)
- 深度学习 (4)
- LLM (4)
- Harness Engineering (3)
- 推荐 (2)
- Transformer (2)
- 强化学习 (1)
- 思维模型 (1)
- 管理 (1)
- 生成式 (1)
本周推荐系统研究的技术主线清晰:生成式推荐正在从"单场景验证"快速演进到"全链路生产系统"。美团、Snapchat、Meta 等头部平台的论文不再探讨 Semantic ID 的基本可行性,而是深入到多业务扩展、codebook 公平性、增量更新和重排序等部署后的实际痛点。MBGR (2604.02684) 在美团外卖多业务场景实现线上 CTR +1.24%,是本周评分最高的工作。 与此并行的另一条主线是 LLM/Agent 范式对推荐与检索的深度渗透。快手将 LLM 推理能力引入电商搜索并设计了去偏 GRPO 变体,Google DeepMind 用 RL 反馈环路对齐对话推荐中的检索器与生成器,Amazon 将非稳态分类重构为基于检索的时序预测。RL 正在成为 LLM 推荐系统的标准训练组件。 工业搜索检索层面,Google 和 Walmart 的三篇论文分别瞄准了非语义查询召回、广告搜索的语义-行为信号统一、以及大规模复购推荐的时序建模,全部带线上 A/B 验证。场景特化的工程-算法协同设计正在取代通用方法论。
本周推荐系统研究围绕三条技术主线展开:生成式推荐的工程落地、Agent 驱动的系统自进化、以及排序模型的高效 scaling。 生成式推荐从"能跑"走向"跑得稳"。 阿里巴巴的 RCLRec 用反向课程学习解决转化信号的极端稀疏问题,线上广告收入 +2.09%;复旦的 DACT 提出 tokenizer 持续更新框架,应对数据分布漂移下的标识符失效。两篇论文的共同指向是——生成式推荐的瓶颈已经不在架构设计,而在工业环境下的持续运行。 阿里巴巴同期发布两篇 Agent 推荐系统论文——AutoModel 给工程蓝图,AgenticRS 给理论框架。 阿里巴巴系统性地探索了将 Agent 范式引入推荐系统全生命周期管理,agent 的角色从"模拟用户"转变为"替代工程师"。不过两篇论文目前都缺乏线上实验数据,能否跑通自动迭代闭环尚待验证。 排序模型的 scaling 竞赛继续加速。 快手的 UniMixer 将 attention、TokenMixer、FM 三类架构统一到一个参数化框架,在同等计算预算下 AUC 优于 RankMixer;Google 的零样本跨域知识蒸馏从 YouTube 迁移知识到 YouTube Music,线上 watch time +1.2%,为低流量场景提供了低成本能力迁移路径。