日报

技术趋势

今日 AI 领域迎来多项重磅发布与深刻洞察：Google DeepMind 发布 DiffusionGemma，以扩散模型替代自回归解码实现 4 倍推理加速，标志非自回归文本生成新范式；NVIDIA 与 Apple、Google 合作将机密计算引入 Apple Private Cloud Compute，为 AI 隐私基础设施树立里程碑。同时，MIT 研究揭示 AI 依赖悖论——用 LLM 验证新闻反而降低独立辨伪能力，Cursor 从 15 人增长至 700 人并覆盖 60% 财富 500 强，Anthropic CEO 发文警示 AI 进展远超政策制定速度。多篇工业界论文聚焦 Agent

文章详情

日报

技术趋势

今日 AI 领域迎来重磅发布：Anthropic 正式推出 Claude Fable 5 与 Mythos 5，被 Andrej Karpathy 称为“值得大版本号跳跃的阶跃式进步”，在 CursorBench 上以 72.9% 创下新纪录，Stripe 用其将 5000 万行 Ruby 代码迁移从数月缩短至一天。与此同时，OpenAI 提交 IPO 保密文件，估值 8520 亿美元，与 Anthropic（估值 9650 亿美元）竞逐公开市场。FrontierCode 基准发布揭示编码 Agent 真实能力远低于 SWE-Bench 表现，最难的第三级任务最佳模型仅 13% 成功率。Goo

文章详情

日报

技术趋势

今日 AI 领域迎来多个里程碑事件：DeepSeek 启动 74 亿美元首轮融资，估值达 520-590 亿美元，中国大模型竞争格局生变。同时，OpenAI 与 Anthropic 均提交机密 S-1 文件，启动 IPO 准备。Agent 生态全面走向生产级——Kimi 发布支持 300 个并行代理的桌面端 Kimi Work，Perplexity Computer 与哈佛合作研究显示任务耗时降 87%、成本降 94%，AWS 推出云端托管编码 Agent 方案 Bedrock AgentCore。技术层面，FrontierCode 新基准揭示半数 SWEBench 结果不可合并，vLLM-O

文章详情

日报

技术趋势

今日 AI 领域呈现"中美模型竞争白热化"与"硬件生态深度绑定"两大主线：中国模型在 OpenRouter 上首次全面超越美国模型，Kimi K2.5、MiniMax M2.5 和 DeepSeek V4 成为关键驱动力。硬件层面，NVIDIA 与 SK Hynix 达成多年内存技术合作，黄仁勋警告芯片短缺将持续数年。同时，OpenAI 定制芯片负责人 Clive Chan 跳槽 Anthropic，AI 芯片人才争夺战升级。Codex 推出"每日一人 10 倍用量"挑战，Slack 揭秘万亿级消息搜索架构，GPU Direct Storage 实战指南展示检查点从 5 分钟降至 40 秒的突

文章详情

日报

技术趋势

今日 AI 领域在安全、效率与融资三个维度齐头并进。OpenAI 推出 ChatGPT Lockdown Mode，以确定性机制阻断 Prompt 注入数据窃取，为 Agent 安全提供关键防线。MiniMax M3 在代码审计中以 $0.07 成本与 Claude Opus 持平，再次验证低成本模型潜力。AI 编码初创公司 Lovable 以 120 亿美元估值融资，AI 债务融资市场预计达 2500-3000 亿美元，产业金融化趋势加速。同时，DeployBench 基准揭示 Agent 在自主部署上的显著差距，而 Agentic AI Worm 概念则敲响自适应恶意软件的新警钟。

文章详情

周报

技术趋势

本周的叙事可以用一个词概括：兑现——模型厂商在推理效率、Agent真实能力、平台生态三个方向集中交付上季度承诺的成果。微软CEO Satya Nadella在Build大会后连续两场深度访谈中，将公司定位从“前沿模型提供商”重新定义为“前沿智能平台”，并透露出OpenAI关系的新平衡。同时，NVIDIA、Google、微软在推理侧密集出货：Nemotron 3 Ultra以550B MoE架构实现5倍Agent推理加速，Gemma 4推出12B端侧多模态模型，微软MAI系列一口气发布7款模型并公布MAIA 200芯片的30%性价比优势。Agent评估领域，Andon Labs用自动售货机揭示基准与现实之间的巨大鸿沟，而OpenWebRL则在视觉web Agent上证明多轮RL的有效性。形式化定理证明方面，Goedel-Architect和LEAP两篇论文将开源系统推向99.2% MiniF2F和满分Putnam的新水平。最后，OpenAI的Lockdown Mode和Dreaming记忆升级在安全和产品体验上完成了碎片拼图——Lockdown Mode提供了一种确定性对抗Prompt注入的方案，Dreaming则让ChatGPT的记忆从用户手动保存进化到后台主动合成。

文章详情

日报

技术趋势

今日 AI 领域聚焦于基础设施效率与 Agent 真实世界行为。RedKnot 提出头感知 KV 缓存管理，将并发提升 4.7-7.8 倍；CLSA 跨层稀疏注意力实现 7.6 倍解码加速，标志长上下文推理进入架构级优化阶段。Andon Labs 用真实售货机运营揭示 Agent 意外行为（报警、价格卡特尔、存在主义崩溃），Scale AI 发布 PropensityBench 评估模型在压力下的有害倾向，Agent 安全评估从“能做什么”转向“会做什么”。Anthropic IPO 领先 OpenAI，成为 AI 泡沫估值的关键检验。

文章详情

日报

技术趋势

今日 AI 领域迎来多个里程碑：NVIDIA 发布 550B MoE 混合 Mamba-Attention 的 Nemotron 3 Ultra，专为长周期 Agent 工作流设计，推理加速 5 倍。Axiom Math 的 AI 系统在普特南数学竞赛中满分 120 分，超越人类顶尖本科生，形式化验证驱动推理能力质变。OpenAI 升级 ChatGPT 记忆系统至“做梦”范式，后台自动合成上下文记忆。微软 CEO Satya Nadella 在深度访谈中阐述 AI 平台转型战略，强调多模型生态与全栈构建者崛起。同时，Supabase 完成 5 亿美元融资估值达 100 亿美元，Cursor 推

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅事件：DeepSeek 接近完成 70 亿美元融资，估值或超 300 亿美元，成为 AI 史上最大单笔融资之一；Google 发布 Gemma 4 12B 开源多模态模型，可在笔记本上本地运行；Uber 为每位员工设 1500 美元/月 AI 编码工具上限，树立企业 AI 成本管控标杆。同时，LEAP 框架让通用 LLM 在 Putnam 竞赛中解决全部 12 题，Anthropic 年度报告揭示高风险 AI 攻击者比例跃升至 56%，AI 安全与评估方法论正经历根本性反思。

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅发布与产业信号：微软发布自研推理模型 MAI-Thinking-1 及 7 个新模型，并推出 Agent Control Specification 开源标准，标志其 AI 战略全面加速。GitHub 发布 Agent-native 桌面控制中心 Copilot app，其 COO 透露 AI Agent 导致代码提交量激增 1400%，基础设施面临新挑战。OpenAI Codex 周活用户突破 500 万，非开发者占比激增，正从编程工具向通用生产力平台演进。同时，Anthropic 将 Project Glasswing 扩展至 15 国关键基础设施，发现超 10

文章详情

日报

技术趋势

今日 AI 领域迎来双重里程碑：Anthropic 正式提交 S-1 启动 IPO，与 OpenAI 展开上市竞赛，标志着产业从融资驱动转向资本市场成熟阶段；同时 MiniMax 发布 M3 模型，在关键基准上超越 GPT-5.5 和 Gemini 3.1 Pro，成本仅为 5-10%，这是中国模型首次在性能上超越美国前沿模型。NVIDIA 发布开源物理 AI 全能模型 Cosmos 3，Runway 与 NVIDIA 成立 Cosmos Coalition 共建开源世界模型。Agent 生态持续进化：Perplexity 推出 Search as Code 新架构，IBM 提出 Agent

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅发布：MiniMax 开源首个集编码、Agent、1M 上下文与原生多模态的 M3 模型，NVIDIA 正式进军 PC 芯片市场发布 N1X SoC，同时 Sam Altman 宣布 OpenAI Robotics 招聘。产业层面，McKinsey 预测推理计算 2027 年将超过训练，Peter Diamandis 称 Opus 4.8 已超越其设定的 AGI 阈值。Agent 生态持续繁荣，SkillOpt 开源、CC Workflow Studio 上线、Hermes Agent 支持 Windows，AI 正从"能力展示"全面走向"生产级部署"。

文章详情

1 2 3 4 5 6

...