AI 技术日报 - 2026-06-29

今日 AI 领域迎来多项重磅进展:DeepSeek V4 发布 DSpark 推测解码框架,推理速度提升 80% 并全栈开源;SubQ 模型以 56 倍注意力加速挑战长上下文瓶颈;Grok 4.5 进入 SpaceX/Tesla 私有测试,GLM-5.2 以 1/6 成本击败 GPT-5.5 引发企业后训练热潮。苹果 Xcode 26.3 原生集成 Agentic Coding,微软 73 亿美元 Fairwater AI 园区启用,AI 基础设施与开发工具正全面走向生产级。

推荐算法日报 - 2026-06-27

[Agent + LLM 驱动推荐系统自动化]:从架构演化到特征筛选,工业界正系统性地引入 LLM Agent 来替代人工专家。腾讯的 NOVA 框架展示了 Agent 如何自动化完成“论文到生产”的模型升级,PayPal 的 EMA-FS 则用增益感知的筛选策略加速 GBDT 训练。核心趋势是从“调参自动化”走向“架构决策自动化”,但验证和风险控制(如 NOVA 的验证级联)是落地的关键。; [归因与增量性:从“归因”到“归因校正”]:广告归因领域正从简单的“最后一次点击”或“多触点归因”转向

AI 技术日报 - 2026-06-27

今日 AI 领域迎来里程碑式发布:OpenAI 正式预览 GPT-5.6 Sol,采用全新架构并支持 1M 上下文,但发布过程罕见地被美国政府干预,需商务部逐客户审批放行,标志着前沿模型监管进入新阶段。与此同时,智谱 AI 开源模型 GLM-5.2 在编码能力上首次超越 GPT-5.5,成本仅为其 1/6,开源社区迎来重要拐点。产业层面,Stripe 分享了年处理 1.4 万亿美元交易的生产级 Agent 架构,快手开源 AgentX 多智能体系统实现超 1 亿年化收入,AI 从能力展示正式进入规模化价值兑现期。

推荐算法日报 - 2026-06-26

生成式推荐进入工业落地爆发期:今日多篇论文(TokenMinds、RaG)将生成式推荐从概念验证推向大规模工业部署。核心趋势是使用统一的Semantic ID (SID) 体系同时表示用户和物品,实现跨场景(长/短视频)的统一建模,并显著降低训练和服务成本。这标志着生成式推荐正从“召回”环节向“排序”和“内容生成”全链路渗透。; 零样本与自适应推理成为降本增效新焦点:面对海量动态物品和复杂查询,工业系统开始探索更智能的资源分配策略。IRENE通过元分类器为未见物品即时合成分类器,解决零样本检索难

AI 技术日报 - 2026-06-26

今日 AI 领域迎来多个里程碑:OpenAI 发布 Agent 经济报告,揭示 Codex 占内部输出 token 的 99.8%,非开发者采用增长 137x;SWE-bench Pro 发布,因旧基准 59.4% 测试用例存在缺陷,Coding Agent 评测标准迎来根本性更新。同时,Sail 获 8000 万美元融资构建长时 Agent 推理基础设施,PimDeWitte 获 3.2 亿美元融资用于世界模型数据采集,标志 Agent 基础设施投资进入爆发期。Notion 集成 Claude 和 Cursor 作为外部 Agent,从生产力工具转型为 AI 编排中枢。

AI 技术日报 - 2026-06-25

今日 AI 领域迎来多个重磅事件:OpenAI 与 Broadcom 发布首款 LLM 推理芯片 'Jalapeño',推理吞吐提升 4 倍;Cursor 在 Colossus 上从零训练 1.5 万亿参数前沿模型,应用层公司自研模型趋势加速;Qualcomm 豪掷 140 亿美元收购 Modular 和 Tenstorrent,挑战 NVIDIA CUDA 垄断。同时,NVIDIA 发布 DFlash 投机解码实现 15 倍推理加速,Google 在 Gemini 3.5 Flash 中推出原生 Computer Use 工具,MCP 协议迎来最大结构更新转向 Stateless 设计。Ag

推荐算法日报 - 2026-06-25

LLM 蒸馏替代点击信号,重塑工业级召回训练范式:今日两篇来自 Walmart 的工业论文均采用 LLM 作为教师模型,生成结构化标注(相关性或意图),替代传统点击信号来训练双塔召回模型。这解决了点击信号中的位置偏差和长尾稀疏问题,并展示了显著的线上收益,标志着工业界正从“数据驱动”向“模型生成数据驱动”的范式转变。; 图基础模型(GFM)评估趋于理性,PFN 范式或成新方向:学术界对 GFM 的评估揭示了其并非普遍优于传统 GNN。只有基于 Prior-data Fitted Networks

AI 技术日报 - 2026-06-24

今日 AI 领域迎来多个里程碑:OpenAI 的 GPT-5 破解三年免疫学谜题,展示了从数据分析到假说生成的科学发现能力;Anthropic 发布 Claude Tag,将 AI 深度集成到 Slack 作为团队持久成员,被 Andrej Karpathy 称为 LLM UI/UX 的第三大范式变革。智谱 GLM-5.2 被推为世界顶级开源模型,母公司 Zai IPO 股价 120 港元。同时,Apple 研究揭示 LLM-as-Judge 评估面板存在“统计幻觉”,Sakana Fugu 发布即遭独立测试质疑,引发对基准测试与真实世界鸿沟的讨论。在效率方面,vLLM 集成 DFlash 投

AI 技术日报 - 2026-06-23

今日 AI 领域安全议题占据核心:五眼联盟联合警告 AI 数月内可发动毁灭性网络攻击,OpenAI 发布 GPT-5.5-Cyber 并推出安全修复工具,Latent Space 播客深度探讨 Mythos 时代红队测试。Cursor 宣布与 SpaceX 联合训练新模型,Perplexity CEO 预测多万亿参数开源模型即将到来。技术层面,LMSYS 联合 NVIDIA 用 SGLang 在 GB300 服务 DeepSeek-V4 实现 5 倍吞吐量提升,Amazon 首次公开 30B 模型自主后训练系统。

AI 技术日报 - 2026-06-22

今日 AI 安全领域爆出重大漏洞:AgentJacking 攻击利用公开的 Sentry 密钥即可劫持 Claude Code、Cursor 等编码 Agent,引发 Agent 供应链安全警报。与此同时,Tesla 提交“MEGAPOD”商标,暗示将 Supercharger 网络转化为分布式 AI 计算平台,边缘计算基础设施迎来新思路。宏观层面,AI 巨头因数据中心巨额支出转向债务融资,2026 年资本支出预计达 7500 亿美元,债券市场正成为科技投资者的新关注焦点。

AI 技术日报 - 2026-06-21

今日 AI 领域聚焦于智能体(Agent)的架构设计与落地原则。Google DeepMind 发布 57 页 ASI 路线图,首次正式定义超级人工智能,并指出硅基智能的固有优势。LlamaIndex CEO 提出 Agent 应使用类似 Google Docs 的双向可编辑文档格式,推动人机协作范式演进。HERE 则提出 LLM 空间推理不应近似计算,应完全卸载给专用执行层,为 Agent 与物理世界交互提供了关键设计原则。此外,一篇系统讲解 Triton 矩阵乘实现的教程,为 LLM 推理优化提供了从入门到实战的优质资源。

推荐算法日报 - 2026-06-20

[大模型适配与效率优化]:今日多篇论文聚焦于如何将大模型(LLM/MLLM)高效应用于推荐与检索系统。核心思路包括将传统信号压缩为“软Token”以适配Transformer架构(Token Factory),以及通过磁盘存储+稀疏过滤(Stellar)或语义缓存校准(Closing the Calibration Gap)来降低推理和检索阶段的内存与计算开销。这表明工业界正从“能否用大模型”转向“如何低成本、高效率地用大模型”。; [多模态检索的冷启动与细粒度问题]:多模态检索是今日另一热点,