2026 年第 13 周(3 月 22-28 日),AI 领域呈现出三条并行但相互关联的叙事线。第一条是多 Agent 编排工具的集中爆发——Cline Kanban、Scion、DeerFlow 2.0 等多个项目在同一周密集发布,标志着行业焦点从"单 Agent 能力"正式转向"多 Agent 协作的工程化"。第二条是基础模型在多个维度同时取得突破:上海 AI Lab 将科学模型推到万亿参数门槛(Intern-S1-Pro),LeCun 团队用 15M 参数解决了困扰世界模型多年的表征崩塌问题(LeWorldModel),字节跳动 Seed1.8 试图用一个模型统一搜索、编程和 GUI 交互的 Agent 能力。第三条是 AI Agent 从开发者工具走向企业基础设施——Anthropic 推出 Computer Use,Cursor 支持自托管 Agent,Box 接入 Codex,"Everything is CLI" 成为新趋势。 这三条叙事线的交汇点是一个正在成形的新共识:AI Agent 的竞赛已经从"模型多聪明"转向"系统多灵活"。编排层、部署层、协议层正在各就各位,形成一个完整的 Agent 基础设施栈。但与此同时,安全和认知债务的警告也在同一周响起——Simon Willison 呼吁放慢 Agent 代码生成速度,litellm 遭遇供应链攻击,提醒我们这个栈的地基尚不牢固。 本周多源数据共 128 条,覆盖博客(12)、论文(30)、推文(50)、播客(6)和 GitHub Trending(30),以下是深度分析。
本周推荐系统研究围绕三条主线展开。第一条是 Semantic ID 生成式推荐从范式验证进入工程深水区——冷启动信号平衡、广告变现兼容、分布外鲁棒性、推理能力注入,五篇论文分别攻克不同的落地痛点,其中阿里巴巴 OneSearch-V2 线上取得 CTR +3.98%、转化率 +3.05% 的实效。第二条是 LLM Agent 在推荐和搜索中的角色正在从"端到端替代"走向"分层协作"——推理归 LLM,执行归确定性模块,训练用强化学习对齐中间步骤与最终目标。第三条是工业搜索排序系统的效率战——淘宝 KARMA 用语义正则化解决 LLM 微调中的知识退化,UniScale 论证数据与模型必须协同扩展,DIET 将训练数据压缩至 1-2% 仍保持性能趋势一致。 本周共收录 16 篇论文。KARMA 是本周最值得关注的工业论文,覆盖淘宝搜索全链路(召回/粗排/精排)并完成线上部署验证。工业界贡献集中在阿里巴巴搜索体系,学术界则在 LLM Agent 与生成式推荐两个方向持续推进。