- 标签:
- 日报 (211)
- 技术趋势 (142)
- AI (137)
- 推荐系统 (116)
- 周报 (33)
- 论文 (19)
- 思考 (7)
- LLM (6)
- Agentic Engineering (6)
- 工具 (4)
- 深度学习 (4)
- 推荐 (3)
- Harness Engineering (3)
- Transformer (2)
- 强化学习 (1)
- 思维模型 (1)
- 管理 (1)
- 生成式 (1)
本周推荐系统研究围绕三条技术主线展开:生成式推荐从架构完备走向工业级工程落地,其中编辑性、长序列建模、物品级评分等关键能力被逐一攻克;LLM增强的推荐从离线推理迈向在线实时,谷歌与快手等团队实现了十亿用户规模的实时用户画像与意图推理;召回排序系统的成本与效率优化出现系统性方案,小红书以90%硬件成本节省为代价将聚类ANNS部署至SSD存储,同时CTR模型的残差路径设计开始突破缩放定律瓶颈。 主线1(生成式检索工程化): 快手推出的OneRetrieval首次实现了可编辑的生成式检索,在替换倒排索引分支后显著提升订单量与CTR;Yandex的Gryphon引入联合训练的物品级评分组件,替换超过15个候选生成器与粗排阶段,召回量Recall@1000提升3.7%;京东的AdaGRPO通过自适应门控GRPO损失,将HR@10从11.01%提升至12.18%;Meta的Beyond Item IDs提出Global-Aware Compression Transformer,将峰值内存降低一个数量级;阿里的SSRLive通过动态语义ID融入用户-主播交互信号,线上观看时长+3.38%。 主线2(LLM推荐实时化): 谷歌的LLM-Based User Personas框架实现了十亿用户规模的实时自然语言用户画像生成,结合知识蒸馏与异步推理在线上A/B测试中显著提升用户价值;快手的AIR通过离线生成原子意图、在线检索组合的方式实现了400倍推理加速,GMV+3.446%;DoorDash的Mind the Gap利用分层RAG从餐厅订单中生成多级分类特征,在零售品类上CTR+2.1%;OPPO的ToolRec为小布助手(1.5亿月活)构建了双层级点击校准机制,CTR显著提升。 主线3(召回排序系统效率优化): 小红书的Helmsman在40台SSD服务器上替代了原需35000核与0.35PB DRAM的HNSW集群,硬件成本节省90%;DeRes通过双路径残差架构在工业CTR数据集上AUC+0.32%,且计算-AUC缩放定律显示8层DeRes匹配16层OneTrans(2倍计算节省);Meta的DUET将用户行为分离为点击与转化两个流,分别用专用Transformer预训练,离线NE降低0.38%;eBay的Representation Curriculum通过分阶段训练缓解曝光依赖信号,冷启动Recall+5.2%。
本周推荐系统研究围绕三条技术主线展开。 主线1:生成式推荐从“能跑”走向““跑得稳”——语义ID与推理能力成为工业焦点。 Pinterest的UniPinRec实现了检索与排序的全栈统一(线上engagement +1%,延迟-11.1%),跳出了生成式推荐仅做检索的边界。快手的OneReason(线上部署)则揭示了思考模式在生成式推荐中无效的根本原因——感知与认知双因素缺失,并给出三级CoT格式和专化-统一训练的解决方案。两者的共同指向是:生成式推荐的核心瓶颈已从模型架构转移至数据形态(语义ID)与系统协同。 主线2:跨域冷启动从“搬特征”到“学迁移”——LLM作为跨域桥接器开始大规模落地。 快手的RGCD-Rep(服务4亿+用户)用MLLM推理蒸馏将短视频用户兴趣迁移至直播,冷启动参与度显著提升。Meta的Quantizing Intent论文(线上AUC +1.522%冷启)则将有机feed行为量化为语义ID注入广告排序,证明行为富集度决定跨域迁移质量。两篇的共同发现是:跨域迁移的关键不在对齐特征,而在构建可迁移的语义表征。 主线3:LLM/Agent增强推荐走向行业差异化——从通用检索到垂直场景的深度适配。 理想汽车的HPRO(132天A/B,销量+9.5%)将偏好优化引入销售线索评分,解决稀疏监督和漏斗层级问题。快手的Taiji(CTR +12.4%,收入+15.2%)提出帕累托最优策略优化,在语义与ID之间找到最优权衡点。Syft的DynaTree(生存率提升1.5倍)则用离线智能体建树+在线轻量子树选择解决时间敏感新闻检索的效率问题。这些工作表明,LLM在推荐中的应用正从“通用方案”走向“场景定制”。