推荐算法日报 - 2026-04-18

生成式推荐迈向工业级部署:今日论文显示,生成式推荐(Generative Retrieval)正从学术探索走向大规模工业应用。以JD的GenRec为代表,研究重点转向解决线上部署的实际挑战,如分页请求一致性、长序列编码成本以及策略对齐,并通过A/B测试验证了显著的线上收益(点击+9.5%),标志着该范式进入实用化阶段。; LLM Agent的个性化推理成为新焦点:基于LLM的推荐代理(Agent)正从利用通用记忆向个性化推理演进。腾讯的SAGER框架首次为每个用户配备可自演化的“策略技能”,实现

推荐算法日报 - 2026-04-17

LLM驱动的推荐系统走向深度融合:今日多篇论文聚焦于如何将大语言模型(LLM)更深度、更有效地融入推荐系统。研究不再停留于简单的提示工程,而是深入到联合生成用户/物品描述(DUET)、统一建模需求预测与推荐(美团)、以及将权威性等复杂信号融入生成式检索(AuthGR),标志着LLM推荐正从“辅助工具”向“核心推理引擎”演进。; 序列推荐模型的精细化与统一化:针对用户行为序列的建模持续深化。一方面,研究致力于增强模型对时间跨度的感知能力(RoTE)或融合多视图信息(MVCrec),以提升序列建模的

推荐算法日报 - 2026-04-16

工业级大规模模型部署优化:今日多篇高评分论文均来自工业界,核心聚焦于如何将性能强大的基础模型(Foundation Models)高效、低成本地部署到超大规模推荐系统中。Meta的两篇工作分别从分层索引和推测性预计算切入,旨在解耦高延迟的模型推理与实时服务路径,在保证性能的同时显著降低线上成本,代表了工业界应对“模型大”与“服务快”矛盾的主流技术方向。; 生成式推荐走向实用化:生成式推荐正从概念验证迈向实际部署。阿里巴巴的UniRec工作通过引入Chain-of-Attribute等机制,形式化

推荐算法日报 - 2026-04-15

语义标识符(Semantic ID)的工业级应用:今日多篇论文聚焦于将连续语义嵌入压缩为离散、可训练的语义标识符(SID),以解决传统ID模型的长尾泛化、冷启动和训练稳定性问题。从字节跳动的R3-VAE到快手的SID-Coord,工业界正系统性地将SID融入召回、排序等核心模块,并已验证其线上业务价值。; 大模型(LLM)驱动的推荐系统优化:LLM的应用正从内容理解扩展到系统优化的各个环节。今日论文展示了LLM在构建跨域语义空间(SemaCDR)、模拟用户行为进行系统评估(ContextSim)

推荐算法日报 - 2026-04-14

序列建模的工程化与效率优化:今日多篇论文聚焦于提升序列推荐系统的效率和实用性。字节跳动提出的IAT框架通过实例压缩来突破手工特征的容量瓶颈,是典型的工业界工程优化方案。同时,学术界也在探索如何在不重训练模型的前提下,高效矫正虚假订单带来的偏差,体现了对系统鲁棒性和计算成本的共同关注。; 表示学习的深度优化与对齐:表示学习依然是提升推荐效果的核心路径。今日论文从不同角度进行优化:DIAURec框架通过统一意图和语言信号来重构表示空间,并引入对齐、均匀性等对比学习目标;TME-PSR则整合时间、多兴

推荐算法日报 - 2026-04-13

📭 今日无新论文:今日精选列表为空,暂无新的技术趋势可供分析。

推荐周报 2026-W15

本周推荐系统研究的技术主线清晰:生成式推荐正在从"单场景验证"快速演进到"全链路生产系统"。美团、Snapchat、Meta 等头部平台的论文不再探讨 Semantic ID 的基本可行性,而是深入到多业务扩展、codebook 公平性、增量更新和重排序等部署后的实际痛点。MBGR (2604.02684) 在美团外卖多业务场景实现线上 CTR +1.24%,是本周评分最高的工作。 与此并行的另一条主线是 LLM/Agent 范式对推荐与检索的深度渗透。快手将 LLM 推理能力引入电商搜索并设计了去偏 GRPO 变体,Google DeepMind 用 RL 反馈环路对齐对话推荐中的检索器与生成器,Amazon 将非稳态分类重构为基于检索的时序预测。RL 正在成为 LLM 推荐系统的标准训练组件。 工业搜索检索层面,Google 和 Walmart 的三篇论文分别瞄准了非语义查询召回、广告搜索的语义-行为信号统一、以及大规模复购推荐的时序建模,全部带线上 A/B 验证。场景特化的工程-算法协同设计正在取代通用方法论。

AI周报 2026-W15

2026-W15(4 月 5-11 日),AI 工程领域完成了一次认知跃迁:围绕模型构建的编排基础设施——业界称之为"马具"(harness)——正式从幕后走向台前。OpenAI 公开了百万行零人工代码实验,Meta 用 50 多个 Agent 构建代码预计算引擎,Claude Code 源码泄露暴露了这套架构的精密程度。三件事指向同一个结论:2026 年的 AI 工程竞争已不在模型层面,而在模型周围的一切。 与此同时,Anthropic、AWS、Microsoft、Google 在同一周各自亮出完整的 Agent 基础设施方案,开源社区在 48 小时内给出替代品。推理效率、竞技编程和 Agent 记忆等方向也出现多点突破。

推荐算法日报 - 2026-04-11

工业界聚焦效率与可扩展性:今日多篇工业界论文(Meta、Walmart、Google、Alibaba)的核心议题是解决大规模推荐系统中的效率瓶颈。无论是通过高效数据选择(Meta)、显式稀疏架构(Alibaba)还是无训练检索(Google),都体现了在模型规模不断增长的趋势下,对训练、推理和系统可扩展性的极致追求。; 多信号融合与去偏成为召回关键:在召回阶段,单纯依赖用户行为信号(如点击)的局限性日益凸显。Walmart的工作通过融合语义相关性、多通道检索先验和行为偏好信号,有效解决了行为信号

推荐算法日报 - 2026-04-10

工业界聚焦“节奏”与“鲁棒性”:今日工业界论文(Walmart, Amazon)的核心在于提升模型在真实业务场景下的稳定性和精准度。Walmart的CASE方法通过解耦物品级复购节奏与跨物品交互,实现了对用户周期性行为的精准建模;Amazon则针对非平稳分类问题,提出通过端到端学习检索历史样本来增强模型的鲁棒性,两者都旨在解决模型在动态、复杂环境下的性能衰减问题。; 学术界探索“多模态”与“可解释性”的融合:多篇学术论文(BRIDGE, HIVE, MARVEL)围绕多模态推理检索展开,核心范式

1
...
56789
...
11