周报

技术趋势

2026-W15（4 月 5-11 日），AI 工程领域完成了一次认知跃迁：围绕模型构建的编排基础设施——业界称之为"马具"（harness）——正式从幕后走向台前。OpenAI 公开了百万行零人工代码实验，Meta 用 50 多个 Agent 构建代码预计算引擎，Claude Code 源码泄露暴露了这套架构的精密程度。三件事指向同一个结论：2026 年的 AI 工程竞争已不在模型层面，而在模型周围的一切。与此同时，Anthropic、AWS、Microsoft、Google 在同一周各自亮出完整的 Agent 基础设施方案，开源社区在 48 小时内给出替代品。推理效率、竞技编程和 Agent 记忆等方向也出现多点突破。

文章详情

推荐系统

日报

工业界聚焦效率与可扩展性：今日多篇工业界论文（Meta、Walmart、Google、Alibaba）的核心议题是解决大规模推荐系统中的效率瓶颈。无论是通过高效数据选择（Meta）、显式稀疏架构（Alibaba）还是无训练检索（Google），都体现了在模型规模不断增长的趋势下，对训练、推理和系统可扩展性的极致追求。; 多信号融合与去偏成为召回关键：在召回阶段，单纯依赖用户行为信号（如点击）的局限性日益凸显。Walmart的工作通过融合语义相关性、多通道检索先验和行为偏好信号，有效解决了行为信号

文章详情

推荐系统

日报

工业界聚焦“节奏”与“鲁棒性”：今日工业界论文（Walmart, Amazon）的核心在于提升模型在真实业务场景下的稳定性和精准度。Walmart的CASE方法通过解耦物品级复购节奏与跨物品交互，实现了对用户周期性行为的精准建模；Amazon则针对非平稳分类问题，提出通过端到端学习检索历史样本来增强模型的鲁棒性，两者都旨在解决模型在动态、复杂环境下的性能衰减问题。; 学术界探索“多模态”与“可解释性”的融合：多篇学术论文（BRIDGE, HIVE, MARVEL）围绕多模态推理检索展开，核心范式

文章详情

推荐系统

日报

生成式推荐进入深水区：今日多篇论文聚焦生成式推荐（GeneRec）的落地挑战与优化。研究重点已从范式验证转向解决实际痛点，如美团提出的树状生成式重排（NSGR）解决视角缺失问题，清华的STAMP框架优化语义ID冗余带来的训练效率瓶颈，Google的CRAB方法则致力于缓解生成式推荐中的流行度偏差。这表明工业界正积极将生成式推荐从理论推向大规模、高性能的线上系统。; LLM从“赋能”到“重塑”推荐架构：LLM的应用正从内容理解、特征生成等辅助角色，深入到推荐系统的核心架构。例如，LGCD框架利用L

文章详情

推荐系统

日报

LLM驱动的推荐范式深化：今日多篇论文聚焦于将大语言模型（LLM）深度融入推荐系统各环节。从对话推荐（RAR, SMTPO）、可解释推荐（MMP-Refer, Rank, Don‘t Generate）到序列推荐（FAERec），LLM不仅作为生成器，更与检索、排序、对齐等传统模块紧密结合，形成“检索增强生成”的主流范式。; 效率与偏差成为工业落地核心关切：随着模型复杂度提升，工业界和学术界均开始重点关注效率与偏差问题。FAVE通过单步生成将推理效率提升一个数量级；DebiasFirst专门解决

文章详情

推荐系统

日报

生成式推荐走向多场景与工业化：今日论文显示，生成式推荐范式正从通用探索迈向解决工业级复杂问题。美团提出的MBGR框架，首次针对多业务场景下的“跷跷板现象”和“表示混淆”问题，设计了业务感知的语义ID和预测结构，并成功线上部署。这标志着生成式推荐正从学术概念走向解决实际业务痛点。; 价值导向与因果推断成为工业优化核心：在广告和B2B销售等直接关乎收入的场景，建模重点正从预测点击率转向最大化增量价值。Google的VALOR框架通过防止因果信号崩溃和引入价值加权排序损失，在线上实现了2.7倍的增量收

文章详情

推荐系统

日报

📭 今日无新论文; 根据过往数据，每日论文更新存在波动，今日暂无精选新论文入库。

本周推荐系统研究围绕三条技术主线展开：生成式推荐的工程落地、Agent 驱动的系统自进化、以及排序模型的高效 scaling。生成式推荐从"能跑"走向"跑得稳"。阿里巴巴的 RCLRec 用反向课程学习解决转化信号的极端稀疏问题，线上广告收入 +2.09%；复旦的 DACT 提出 tokenizer 持续更新框架，应对数据分布漂移下的标识符失效。两篇论文的共同指向是——生成式推荐的瓶颈已经不在架构设计，而在工业环境下的持续运行。阿里巴巴同期发布两篇 Agent 推荐系统论文——AutoModel 给工程蓝图，AgenticRS 给理论框架。阿里巴巴系统性地探索了将 Agent 范式引入推荐系统全生命周期管理，agent 的角色从"模拟用户"转变为"替代工程师"。不过两篇论文目前都缺乏线上实验数据，能否跑通自动迭代闭环尚待验证。排序模型的 scaling 竞赛继续加速。快手的 UniMixer 将 attention、TokenMixer、FM 三类架构统一到一个参数化框架，在同等计算预算下 AUC 优于 RankMixer；Google 的零样本跨域知识蒸馏从 YouTube 迁移知识到 YouTube Music，线上 watch time +1.2%，为低流量场景提供了低成本能力迁移路径。

文章详情

推荐系统

日报

📭 今日无新论文：根据提供的数据，今日（2026-04-05）没有新的精选论文收录。趋势分析将基于近期普遍关注的技术方向进行简要回顾。; 近期持续热点：工业界推荐系统的核心挑战仍集中在多目标优化、大规模检索效率、序列建模与长短期兴趣融合以及利用大语言模型（LLM）增强推荐理解与生成能力等方面。; 实践导向研究：高质量的论文通常具备清晰的问题定义、可复现的技术方案以及（对于工业界论文）线上AB实验验证，这些是评估其价值的关键。

文章详情

推荐系统

日报

检索技术的精细化与显式化：今日论文显示，检索（包括查询改写和向量召回）技术正从“黑盒”走向“显式”和“可控”。无论是通过构建显式改写模式库来引导LLM生成（ReFormeR），还是设计感知数据异质性的度量与索引框架来提升混合检索的鲁棒性（STABLE），都强调了对检索过程的可解释性和可控性的追求，以应对复杂、异构的真实数据。; 后处理校正的演进：在模型排序后，通过轻量级后处理模块进行精细化校正，正成为解决特定偏差（如长尾问题）的有效手段。REPAIR框架通过残差分解，自适应地结合类间和成对校正，

文章详情

推荐系统

日报

推荐系统架构的统一与高效化：工业界正致力于将不同范式的推荐模型（如基于注意力、TokenMixer、因子分解机）整合到统一的理论框架中，以提升模型缩放效率。同时，通过设计轻量级模块（如UniMixing-Lite）来优化参数量和计算成本，追求更高的ROI。; 个性化偏差校正成为新焦点：针对推荐系统中长期存在的流行度偏差问题，研究正从全局去偏转向更精细的个性化校准。通过量化用户个人偏好与推荐结果之间的对齐度，并在推理时进行动态调整，旨在实现更精准的偏好匹配，而非简单地抑制流行度。; 🤖 Agen

文章详情

推荐系统

日报

生成式推荐的工程化探索：今日多篇论文聚焦生成式推荐（GRM）的落地挑战，从tokenizer的持续学习（DACT）、冷启动场景的系统性评估，到利用DPO进行偏好对齐（RoDPO），显示出学术界正从理论模型转向解决实际部署中的稳定性、适应性和效率问题。; 跨域/跨模态的知识迁移与对齐：工业界和学术界都在探索如何高效利用已有知识。Google通过零样本跨域蒸馏将视频推荐知识迁移至音乐推荐；阿里通过指令微调和RLHF实现多模态重排的领域自适应；微软则从理论上分析了单向量嵌入在跨域检索中的根本局限，均体

文章详情

...

16 17 18 19 20 21