今日 AI 领域生态与工程齐头并进:Anthropic 新隐私政策引发争议,Sakana AI 推出 8 小时深度研究 Agent Marlin,vLLM v0.23.0 全面支持 DeepSeek-V4。OpenAI 投入 1.5 亿美元构建合作伙伴网络,目标培训 30 万认证顾问。AWS 发布 Agent 故障检测工具 Strands Evals Detector,同时 Kubernetes GPU 时间切片隐藏代价被揭示——多 Agent 共享 GPU 时 p99 延迟飙升 66%。论文方面,Microsoft 提出几何诊断方法揭示 LLM-as-Judge 的共享偏差,Amazon 推
今日 AI 领域监管与效率两大主题交织:美国当局以安全为由暂停 Anthropic 最先进模型 Fable 5 和 Mythos 5 的访问,联合创始人 Andrej Karpathy 因非美国公民身份被拒接触内部模型,引发对"主权 AI"政策的广泛争议。与此同时,AMD 发布 Ryzen AI Max+ 395,以 128GB 共享内存和 1,499 美元售价实现本地运行 235B 模型,推理性能据称超 RTX 5080 三倍,标志着消费级硬件与云 AI 订阅的性价比拐点。产业层面,Mistral AI 以 200 亿欧元估值融资,欧洲主权 AI 从叙事走向现实;而 'Agentjackin
今日 AI 领域迎来多个重磅事件:Jeff Bezos 首次公开其 AI 创业公司 Prometheus,以 120 亿美元融资和 410 亿美元估值成为 2026 年最大 AI 融资事件。模型竞争格局突变,GPT-5.5 在全新 Agents' Last Exam 基准上意外击败 Claude Fable 5,而 Anthropic 因社区抗议撤回对 Claude Fable 5 的隐形限制政策。OpenAI 收购云编排公司 Ona 为 Codex Agent 构建持久化企业环境,AWS 发布 Agent-EvalKit 开源评估工具,Agent 基础设施正加速走向生产级。学术方面,阿里 Q
今日 AI 领域迎来重磅发布:Anthropic 正式推出 Claude Fable 5 与 Mythos 5,被 Andrej Karpathy 称为“值得大版本号跳跃的阶跃式进步”,在 CursorBench 上以 72.9% 创下新纪录,Stripe 用其将 5000 万行 Ruby 代码迁移从数月缩短至一天。与此同时,OpenAI 提交 IPO 保密文件,估值 8520 亿美元,与 Anthropic(估值 9650 亿美元)竞逐公开市场。FrontierCode 基准发布揭示编码 Agent 真实能力远低于 SWE-Bench 表现,最难的第三级任务最佳模型仅 13% 成功率。Goo
今日 AI 领域迎来多个里程碑事件:DeepSeek 启动 74 亿美元首轮融资,估值达 520-590 亿美元,中国大模型竞争格局生变。同时,OpenAI 与 Anthropic 均提交机密 S-1 文件,启动 IPO 准备。Agent 生态全面走向生产级——Kimi 发布支持 300 个并行代理的桌面端 Kimi Work,Perplexity Computer 与哈佛合作研究显示任务耗时降 87%、成本降 94%,AWS 推出云端托管编码 Agent 方案 Bedrock AgentCore。技术层面,FrontierCode 新基准揭示半数 SWEBench 结果不可合并,vLLM-O
今日 AI 领域呈现"中美模型竞争白热化"与"硬件生态深度绑定"两大主线:中国模型在 OpenRouter 上首次全面超越美国模型,Kimi K2.5、MiniMax M2.5 和 DeepSeek V4 成为关键驱动力。硬件层面,NVIDIA 与 SK Hynix 达成多年内存技术合作,黄仁勋警告芯片短缺将持续数年。同时,OpenAI 定制芯片负责人 Clive Chan 跳槽 Anthropic,AI 芯片人才争夺战升级。Codex 推出"每日一人 10 倍用量"挑战,Slack 揭秘万亿级消息搜索架构,GPU Direct Storage 实战指南展示检查点从 5 分钟降至 40 秒的突