Recsys Frontier

频域分析与序列建模融合：今日多篇论文探索了在频域（FEDIN）或连续时间域（BST-CDSR）建模用户行为，以捕捉传统时序方法难以处理的周期性模式和兴趣衰减，为序列推荐提供了新的信号增强思路。; LLM 从“生成”走向“评估与攻击”：LLM 的应用场景从内容生成扩展到模型评估与安全测试。CRAFT 利用 LLM 生成对抗样本来攻击排序模型，而 BST-CDSR 则利用 LLM 提取时间语义，展示了 LLM 在推荐系统攻防与特征工程中的潜力。; ⚖️ 公平性与评估稳定性成为焦点：工业界和学术界均开

今日日报跨越博客文章、GitHub 项目、KOL 推文三大数据源，共 17 篇文章、5 个热门项目、24 条推文。核心亮点是 AI 系统自我构建的趋势加速：Import AI 预测 2028 年前无人类参与的 AI 研发概率超 60%，同时多智能体框架（AG2、PraisonAI）和金融研究 Agent（Dexter）等实用工具涌现，行业正从“使用 AI”迈向“AI 构建 AI”。精选文章 5 篇（5分 1 篇，4分 4 篇） GitHub 热门项目 5 个（5分 3 个，4分 2 个） X 推文 24 条

推荐系统

工业级系统优化与效率提升：今日多篇工业界论文（Meta、IKEA）聚焦于在不牺牲模型效果的前提下，通过系统级创新（如IEFF的弹性特征衰减）或训练数据优化（如IKEA的结构化负采样）来提升大规模推荐系统的迭代效率和资源利用率。这反映了工业界从追求模型复杂度转向关注工程效率与落地可行性的趋势。; LLM与推荐系统的深度融合与挑战：多篇论文（DynamicPO、IKEA、RIR综述）探讨了LLM在推荐系统中的应用，但同时也揭示了新的挑战，如偏好优化崩溃、零点击行为对线上效果的制约，以及LLM作为信息

周报

如果要为 2026 年第 18 周挑一句话作为总结，那是：模型差距在收敛，能力差距却在扩大，差距的来源已经从"prompt 怎么写"转移到"模型外那一层怎么搭"。Codex 一周之内完成从编码 Agent 到通用工作平台的跃迁、Karpathy 在 Sequoia Ascent 给 Software 3.0 提供哲学锚点、Lin et al. 用 AHE 论文给"harness engineering"正式命名，三件事在同一周共振；Anthropic 把 Claude Code 企业日均成本估算从 $6 翻倍到 $13、GitHub Copilot 切换到 usage-based 计费，则在定价端反向印证 harness 已经成为主要成本中心。研究界并不甘只做产品的注脚——RecursiveMAS 把多 Agent 通讯从文本传递推到潜在空间递归，Berkeley GEPA 让 reflection LLM 读完整 rollout 重写 prompt 击败 GRPO 10 个百分点，Apple 与 Oracle 各自给多 Agent 系统装上可信度量，HiddenBench 在 ICML 2026 揭穿前沿模型在分布式任务上 70% 的失败率。同期，Latent Space、HuggingFace、Stratechery 三方信号汇聚成一条共识：训练算力之后，推理与评估正成为下一道结构性瓶颈，Meituan、NVIDIA、Salesforce、Amazon、Hippocratic AI、Meta 同周交出六篇推理优化论文，Anthropic 的成本翻倍则是给这场"inference inflection"贴上的价签。 OpenAI 与微软七年合作关系正式松绑，AWS Bedrock Managed Agents 同步登场，多云时代被合同条款写死；NVIDIA、OpenBMB、智谱、Oracle 在多模态 Agent 模型这条线一周齐发四枪；ZenBrain、AgentCore、ObjectGraph、Synthetic Computers 把 Agent 持久记忆问题摆上学术台面；Computer Use 借助 DeepSeek 的视觉接地、Browser Use Box 与 Cua 的沙箱基础设施，从 demo 走向工程化基础设施。这是一周里五条主线同时发声的少数时刻。

从 Vibe Coding 到 Agentic Engineering 的演进，系统梳理 Claude Code 命令体系、Skills 系统、Hooks、Subagents、MCP 服务器、辅助工具生态及核心工作流。

今日日报跨越了 X 推文动态和 GitHub 热门项目两大数据源，核心亮点在于 AI Agent 从“炒作”走向“务实落地”。一方面，多位 KOL 对 LLM Agent 的理性决策能力提出质疑，强调人类监督的必要性；另一方面，大量工具和最佳实践涌现，如 OpenAI Agents SDK 2.0、JP Morgan 的多 Agent 系统架构、以及 Anthropic 的零员工公司指南，标志着行业正在从概念验证转向工程化部署。此外，多个专为特定场景（如 n8n 工作流、DeepSeek 模型、iOS 开发）打造的 Agent 工具在 GitHub 上获得高星关注，显示出 Agent 生态的垂

今日日报跨越博客、X 推文和 GitHub 项目三大数据源，核心趋势是 Agent 生态的全面爆发与工具链的快速成熟。从 OpenAI 开源编排器 Symphony 到 Mistral 发布远程 Agent，从 13 岁学生用 Claude Code 秒解编程题到多款 token 节省工具涌现，AI Agent 正从概念验证走向生产级应用，同时模型智能提升（如 Sam Altman 强调）与算力需求（AI CPU 内存短缺）成为并行主线。 *数据统计：精选文章 1 篇、GitHub 项目 3 个、KOL 推文 23 条。

今日日报跨越博客、GitHub 项目、播客和 X 推文，核心亮点是 Agent 应用全面爆发：从 OpenAI 的 Codex 扩展到知识工作领域，到 Meta 的 Autodata 框架实现自动化数据科学，再到社区涌现的低代码 Agent 编排平台 Sim。同时，GPT-5.5 在网络安全测试中追平 Claude Mythos，AI 安全与能力边界成为热议焦点。数据统计：精选文章 4 篇、GitHub 项目 3 个、播客 2 集、KOL 推文 24 条。

今日日报跨越博客、GitHub 项目、论文、KOL 推文和播客，核心亮点是 Agent 从“单兵作战”走向“网络化协作”与“自主化运行” 的加速趋势。微软对多 Agent 网络的红队测试揭示了级联故障风险，Karpathy 则定义了 Software 3.0 时代的新范式，而 NVIDIA、OpenAI 和 DeepMind 分别从基础设施、工具和行业应用角度推动 Agent 落地。此外，安全与防御成为焦点，OpenAI 推出网络安全模型，Cursor 和 n8n 等工具也在强化 Agent 的安全审查与编排能力。精选文章： 5 篇（5 分 2 篇，4 分 3 篇） GitHub 热门项目：

今日日报跨越博客、GitHub、论文、推文和播客五大数据源，核心趋势指向 AI Agent 正从概念验证走向规模化落地。从 Microsoft AI 业务年收入 370 亿美元、Sequoia 称 AI 处理约 50% 软件工程，到 Cursor/Google 发布 Agent SDK/CLI，再到 DeepSeek V4 Pro 与 Ling-2.6-1T 等大模型发布，行业正围绕 Agent 构建基础设施、工具链和评估体系。同时，AI 评估成本成为新瓶颈、推理计算需求爆发等趋势也值得关注。精选文章 5 篇、GitHub 项目 5 个、播客 1 集、KOL 推文 24 条

今日日报跨越博客、GitHub 项目、KOL 推文三大数据源，核心亮点是 OpenAI 与 AWS 的战略结盟（Bedrock Managed Agents）以及 NVIDIA 开源多模态 Agent 模型 Nemotron 3 Nano Omni。同时，AI Agent 的安全与治理问题（生产数据库被误删、支付协议标准化）成为行业热议焦点。精选文章 5 篇、GitHub 项目 2 个、KOL 推文 24 条。

今日日报跨越博客、GitHub 项目、论文和 KOL 推文四大数据源，核心亮点是 AI Agent 的全面爆发与安全反思。从金融交易、客服系统到编码代理，Agent 应用正快速渗透各领域；同时，Claude 编码代理误删生产数据库的事件引发了行业对 Agent 安全边界的深刻讨论。此外，OpenAI 与微软协议的重大变更、阿里万亿参数 MoE 模型的发布，以及微软 VibeVoice 的开源，共同构成了今日的技术焦点。 *数据统计：精选文章 5 篇、GitHub 项目 3 个、KOL 推文 18 条、播客 1 集。