推荐系统 20 年来方法换了六七轮，但问题定义从未改变——始终是预测下一个 item。缺多样性、缺发现性、规则泛滥，根源都在这里。真正的范式改变不是换方法，而是重新定义问题：从 Next One 到 Next N。

覆盖 101 篇核心论文（58 篇工业界 + 43 篇学术精选），系统梳理 2022-2026 年生成式推荐从学术概念到工业主流范式的完整技术演进。以 TIGER、HSTU、OneRec 等里程碑论文为核心，深入分析 Semantic ID、模型架构、训练范式、推理增强、长序列建模等关键技术方向。

文章详情

推荐系统

深度学习

技术趋势

2017 年，Ilya Sutskever 读到《Attention Is All You Need》时，立即意识到”这就是我们需要的一切”。OpenAI 随即放弃了 RNN/LSTM 路线，全面转向 Transformer，催生出整个 GPT 系列。Transformer 的并行能力让他们得以实现一直相信的 Scaling 路径。八年后的今天，推荐系统终于走到了同样的路口。 2024 年之前，推荐领域有了 HSTU、TIGER 这样的工作，但大多数团队还在观望。2025 年，我观察到一个明显的转变：大家开始认真地把排序模型 Dense Scaling Up，搞生成式召回和端到端推荐。这很像 2017 年——当时大家忙着把 LR/GBDT/FM 切换到 Deep Model 和双塔，切换过程持续了一两年，之后再没人回头。我的判断是，2026 年将是推荐系统 All-In Transformer 的一年，不改变就落后。

文章详情

日报

技术趋势

今日日报跨越博客、GitHub 项目、播客和 KOL 推文等多个数据源，核心趋势是 “Agent 工具生态趋同与规模化落地”。从 OpenAI 的 Codex 移动端发布、xAI 的 Grok Build CLI，到 Anthropic 的美中 AI 竞争白皮书和 Epoch AI 的万亿美元数据中心成本估算，行业正从单一模型能力竞争转向 Agent 工作流、基础设施和地缘战略的全面博弈。同时，医疗、学术等垂直领域的 AI 原生实践也提供了宝贵的落地经验。精选文章 5 篇、GitHub 项目 5 个、播客 4 集、KOL 推文 21 条

文章详情

日报

技术趋势

今日 AI 日报跨越博客、GitHub、推文三大数据源，核心亮点是 Agent 技术从“概念验证”全面进入“工程落地”阶段。OpenAI 披露 Codex 沙箱安全细节，AWS 联合 Cisco 推出 Agent 安全治理方案，GitHub 上涌现出多个即插即用的 Agent 技能框架和基础设施项目。同时，行业战略层面出现重要信号：Stratechery 将 AI 部署类比为 1970 年代的大型机浪潮，NVIDIA 与 AlphaGo 之父合作押注强化学习基础设施。 *数据统计：精选文章 5 篇、GitHub 项目 5 个、KOL 推文 28 条。

文章详情

日报

技术趋势

今日日报跨越了博客、GitHub 项目、论文和 KOL 推文等多个数据源。核心亮点是：实时语音交互模型取得重大突破（Thinking Machines 发布 TML-Interaction-Small），同时 AI 领域的资本运作和商业竞争持续升温（Cerebras IPO、Anthropic 融资、OpenAI 重谈微软协议）。此外，开源生态的成本结构、多智能体框架和推理优化也是今日热点。 *数据统计：精选文章 5 篇、GitHub 项目 5 个、论文 0 篇、KOL 推文 27 条

文章详情

日报

技术趋势

今日日报跨越博客、GitHub、论文、KOL 推文和播客五大数据源，核心亮点是 AI 基础设施正从“训练优先”向“推理优先”加速转变。Stratechery 的长文系统性地剖析了推理工作负载的独特性，而 OpenAI 推出 Daybreak 安全产品与 Deployment Company、AWS 上线原生 Claude 平台、以及多个 Agent 框架（Hugging Face Skills、UI-TARS）的发布，共同指向 AI 应用部署与 Agent 生态的成熟化。此外，Ilya Sutskever 在庭审中的证词与 Epoch AI 对 FrontierMath 基准的修正，也为行业带

文章详情

日报

技术趋势

今日日报跨越博客文章、GitHub 项目、KOL 推文三大数据源。核心亮点是 Agent 基础设施的全面爆发：从 Anthropic 官方发布的标准化技能包，到开源社区涌现的自我改进代理框架和记忆层，再到 GPU 编程的 Rust 化探索，AI 正从“对话工具”加速迈向“可编程、可记忆、可自主行动”的生产力实体。此外，成本优化（如用开源替代高价订阅）和本地化部署（如制造业的 AMD MI300X 方案）成为重要实践方向。 *数据统计：精选文章 3 篇、GitHub 项目 5 个、KOL 推文 12 条。

文章详情

日报

技术趋势

今日日报跨越博客、GitHub 项目、X 推文三大数据源。核心亮点是 AI Agent 生态的全面爆发：从政策框架到开源框架，从官方 SDK 到自进化机制，Agent 正在从概念走向工程化落地。同时，芯片层（Cerebras IPO、InP 衬底短缺）和模型层（ERNIE 5.1、MiniCPM-o 4.5）也有重要进展。精选文章 1 篇、GitHub 项目 5 个、KOL 推文 22 条。

文章详情

周报

技术趋势

本周 AI 行业的核心叙事线在三个层面同时收紧。最显眼的是 Anthropic 的 Code with Claude 2026 大会——Claude Managed Agents 同日发布 Outcomes、多 Agent 编排、Dreaming（夜间自我改进）和桌面 Claude Code，配合 SpaceX Colossus $5B/年算力交易和让 Mozilla 单月修复 423 个 Firefox 漏洞的 Claude Mythos 预览，把 Agent 从"一次性脚本"完整推进到"持续运营单元"。紧贴这条产品线的是研究和工程层面的 Agent Harness Engineering 浪潮。复旦/北大的 AHE 论文、Microsoft 的 Terminus-4B 小模型 subagent、GitHub 自家的 token 审计工作流、Cursor 的 /orchestrate 与 Command Code 的 plumbing 经验，从同一周的不同角度证明：harness 与上下文工程已经成为比模型本身更值得投入的赛道。配合 vLLM × Mooncake 把 KV cache 命中率从 1.7% 拉到 92.2%、Insforge 让 Claude Code 节省 3x token 等具体数字，"先看 harness 还有多少没榨干"正在替代"换更强模型"成为默认动作。第三条线是基础设施。推理 token 价格一年降 100x，但 hyperscaler 总账单也涨 100x——Jevons paradox 在万亿美元尺度重演。DeepSeek 自报 agentic workload 的 98.7% KV cache 命中率，OpenAI 联合五家硬件厂商发布 MRC 网络协议，Perplexity 自研 ROSE 引擎，NVIDIA 开源 TokenSpeed，再加上 Meta FAIR 的 Compute Optimal Tokenization、Snowflake 的 ZeRO-Prefill、Sakana × NVIDIA 的 TwELL 稀疏格式——整个产业第一次在同一时段集中地把 KV cache、内存层级和网络 fabric 摆到了 GPU FLOPS 之上。

文章详情

日报

技术趋势

今日日报跨越博客、GitHub、论文、KOL推文和播客五大数据源，核心亮点是AI推理效率与Agent安全性的双重突破。BAIR博客系统梳理了自适应并行推理新范式，Anthropic与OpenAI分别从对齐研究和安全运行角度推进Agent落地，而LobeHub等开源项目则让Agent协作触手可及。行业层面，Anthropic估值超越OpenAI、大科技公司AI资本支出超7150亿美元等数据，揭示了AI行业“强者愈强”的马太效应。精选文章 5 篇 | GitHub 项目 5 个 | 播客 1 集 | KOL 推文 23 条

文章详情

日报

技术趋势

今日日报跨越博客、GitHub 项目、论文、KOL 推文和播客，核心亮点是 AI Agent 的工程化与成本优化成为绝对主线。从 GitHub 的 token 效率实践、Cursor 的递归 Agent 技能，到开源项目 Goose 和 9Router 的发布，业界正从“能用”转向“好用且省钱”。同时，推理成本下降 100 倍但总账单上升 100 倍的 Jevons 悖论引发广泛讨论，揭示了 Agent 化带来的需求爆发。精选文章：5 篇 | GitHub 项目：5 个 | KOL 推文：22 条 | 播客精选：2 集

文章详情

1 2 3 4 5 6

...