日报

技术趋势

今日 AI 领域生态与工程齐头并进：Anthropic 新隐私政策引发争议，Sakana AI 推出 8 小时深度研究 Agent Marlin，vLLM v0.23.0 全面支持 DeepSeek-V4。OpenAI 投入 1.5 亿美元构建合作伙伴网络，目标培训 30 万认证顾问。AWS 发布 Agent 故障检测工具 Strands Evals Detector，同时 Kubernetes GPU 时间切片隐藏代价被揭示——多 Agent 共享 GPU 时 p99 延迟飙升 66%。论文方面，Microsoft 提出几何诊断方法揭示 LLM-as-Judge 的共享偏差，Amazon 推

文章详情

日报

技术趋势

今日 AI 领域监管与效率两大主题交织：美国当局以安全为由暂停 Anthropic 最先进模型 Fable 5 和 Mythos 5 的访问，联合创始人 Andrej Karpathy 因非美国公民身份被拒接触内部模型，引发对"主权 AI"政策的广泛争议。与此同时，AMD 发布 Ryzen AI Max+ 395，以 128GB 共享内存和 1,499 美元售价实现本地运行 235B 模型，推理性能据称超 RTX 5080 三倍，标志着消费级硬件与云 AI 订阅的性价比拐点。产业层面，Mistral AI 以 200 亿欧元估值融资，欧洲主权 AI 从叙事走向现实；而 'Agentjackin

文章详情

日报

技术趋势

今日 AI 领域地缘政治风险加剧：美国政府直接指令 Anthropic 暂停 Fable 5/Mythos 5 对外国用户访问，出口管制从地域转向个人身份，MiniMax 随即宣布 M3 开源并强硬回应。同时，GitHub 分享 Copilot CLI 委派优化实践，NVIDIA Blackwell 在首个 Agentic AI 基础设施基准 AgentPerf 中领跑，微软 Project Ire Agent 成功自主识别恶意软件变种，Agent 工程正从概念走向生产级精细优化。

文章详情

周报

技术趋势

上周的核心叙事可以浓缩成三个字——“够用了”。Claude Fable 5 的发布将通用模型能力拉到新高度，同时定价砍半。但更重要的是，围绕 Agent 的评估、安全、记忆和推理优化，工业界的交付物开始从“论文概念”变成“可运行的代码和框架”。Anthropic 的预填撤回风波、Kimi Work 的 300 个本地并行 Agent、MiniMax 的稀疏注意力内核——这些事件共同指向一个信号：2026 年上半年的 AI 工程化，正在从“能不能跑”转向“能不能可靠地跑”。

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅发布：MiniMax 开源 428B MoE 模型 M3，搭载自研稀疏注意力实现 1M 上下文 14 倍加速；Kimi 发布 K2.7-Code，编码 agent 能力提升超 30% 且推理 token 减少 30%。同时，Sapient 公司声称以约 1500 美元从零训练出 1B 基座模型 HRM-Text，直接挑战预训练 Scaling Law。MCP Dev Summit 2026 释放协议无状态化与 'Shadow MCP' 治理挑战等关键信号。产业层面，Q1 AI 融资 242B 美元中四大公司吸走 65%，资本集中度持续加剧。

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅事件：Jeff Bezos 首次公开其 AI 创业公司 Prometheus，以 120 亿美元融资和 410 亿美元估值成为 2026 年最大 AI 融资事件。模型竞争格局突变，GPT-5.5 在全新 Agents' Last Exam 基准上意外击败 Claude Fable 5，而 Anthropic 因社区抗议撤回对 Claude Fable 5 的隐形限制政策。OpenAI 收购云编排公司 Ona 为 Codex Agent 构建持久化企业环境，AWS 发布 Agent-EvalKit 开源评估工具，Agent 基础设施正加速走向生产级。学术方面，阿里 Q

文章详情

日报

技术趋势

今日 AI 领域迎来多项重磅发布与深刻洞察：Google DeepMind 发布 DiffusionGemma，以扩散模型替代自回归解码实现 4 倍推理加速，标志非自回归文本生成新范式；NVIDIA 与 Apple、Google 合作将机密计算引入 Apple Private Cloud Compute，为 AI 隐私基础设施树立里程碑。同时，MIT 研究揭示 AI 依赖悖论——用 LLM 验证新闻反而降低独立辨伪能力，Cursor 从 15 人增长至 700 人并覆盖 60% 财富 500 强，Anthropic CEO 发文警示 AI 进展远超政策制定速度。多篇工业界论文聚焦 Agent

文章详情

日报

技术趋势

今日 AI 领域迎来重磅发布：Anthropic 正式推出 Claude Fable 5 与 Mythos 5，被 Andrej Karpathy 称为“值得大版本号跳跃的阶跃式进步”，在 CursorBench 上以 72.9% 创下新纪录，Stripe 用其将 5000 万行 Ruby 代码迁移从数月缩短至一天。与此同时，OpenAI 提交 IPO 保密文件，估值 8520 亿美元，与 Anthropic（估值 9650 亿美元）竞逐公开市场。FrontierCode 基准发布揭示编码 Agent 真实能力远低于 SWE-Bench 表现，最难的第三级任务最佳模型仅 13% 成功率。Goo

文章详情

日报

技术趋势

今日 AI 领域迎来多个里程碑事件：DeepSeek 启动 74 亿美元首轮融资，估值达 520-590 亿美元，中国大模型竞争格局生变。同时，OpenAI 与 Anthropic 均提交机密 S-1 文件，启动 IPO 准备。Agent 生态全面走向生产级——Kimi 发布支持 300 个并行代理的桌面端 Kimi Work，Perplexity Computer 与哈佛合作研究显示任务耗时降 87%、成本降 94%，AWS 推出云端托管编码 Agent 方案 Bedrock AgentCore。技术层面，FrontierCode 新基准揭示半数 SWEBench 结果不可合并，vLLM-O

文章详情

日报

技术趋势

今日 AI 领域呈现"中美模型竞争白热化"与"硬件生态深度绑定"两大主线：中国模型在 OpenRouter 上首次全面超越美国模型，Kimi K2.5、MiniMax M2.5 和 DeepSeek V4 成为关键驱动力。硬件层面，NVIDIA 与 SK Hynix 达成多年内存技术合作，黄仁勋警告芯片短缺将持续数年。同时，OpenAI 定制芯片负责人 Clive Chan 跳槽 Anthropic，AI 芯片人才争夺战升级。Codex 推出"每日一人 10 倍用量"挑战，Slack 揭秘万亿级消息搜索架构，GPU Direct Storage 实战指南展示检查点从 5 分钟降至 40 秒的突

文章详情

日报

技术趋势

今日 AI 领域在安全、效率与融资三个维度齐头并进。OpenAI 推出 ChatGPT Lockdown Mode，以确定性机制阻断 Prompt 注入数据窃取，为 Agent 安全提供关键防线。MiniMax M3 在代码审计中以 $0.07 成本与 Claude Opus 持平，再次验证低成本模型潜力。AI 编码初创公司 Lovable 以 120 亿美元估值融资，AI 债务融资市场预计达 2500-3000 亿美元，产业金融化趋势加速。同时，DeployBench 基准揭示 Agent 在自主部署上的显著差距，而 Agentic AI Worm 概念则敲响自适应恶意软件的新警钟。

文章详情

周报

技术趋势

本周的叙事可以用一个词概括：兑现——模型厂商在推理效率、Agent真实能力、平台生态三个方向集中交付上季度承诺的成果。微软CEO Satya Nadella在Build大会后连续两场深度访谈中，将公司定位从“前沿模型提供商”重新定义为“前沿智能平台”，并透露出OpenAI关系的新平衡。同时，NVIDIA、Google、微软在推理侧密集出货：Nemotron 3 Ultra以550B MoE架构实现5倍Agent推理加速，Gemma 4推出12B端侧多模态模型，微软MAI系列一口气发布7款模型并公布MAIA 200芯片的30%性价比优势。Agent评估领域，Andon Labs用自动售货机揭示基准与现实之间的巨大鸿沟，而OpenWebRL则在视觉web Agent上证明多轮RL的有效性。形式化定理证明方面，Goedel-Architect和LEAP两篇论文将开源系统推向99.2% MiniF2F和满分Putnam的新水平。最后，OpenAI的Lockdown Mode和Dreaming记忆升级在安全和产品体验上完成了碎片拼图——Lockdown Mode提供了一种确定性对抗Prompt注入的方案，Dreaming则让ChatGPT的记忆从用户手动保存进化到后台主动合成。

文章详情

1 2 3 4 5 6

...