AI 技术日报 - 2026-06-20

今日 AI 领域迎来多个关键节点:DeepSeek 开源 1.6T 参数的 V4 系列模型,在百万 token 上下文中实现 3.7 倍 FLOPs 降低,多项基准超越 GPT-5.4 和 Claude Opus 4.6。同时,Subquadratic 公司声称突破 Transformer 注意力 O(n²) 瓶颈,获 MIT Tech Review 深度报道,但模型尚未公开引发业界观望。GLM-5.2 获 Jeremy Howard 等社区领袖认可,成为首个在日常使用中接近前沿水平的开源模型。此外,GitHub 分享了内部数据分析 Agent Qubot 的完整构建经验,CMU 的 TheA

推荐算法日报 - 2026-06-19

全链路协同设计成为工业界新范式:Meta 的 RankGraph-2 和 Airbnb 的 JourneyFormer 都展示了从数据构建、模型训练到在线服务的端到端协同优化思路。RankGraph-2 更是明确提出图构建、训练、服务三阶段生命周期协同设计,通过各阶段需求相互约束来提升整体效率,这标志着工业界推荐系统正从单点优化走向全链路系统级优化。; 多语言/跨域检索成为热点,工业界与学术界共同发力:今日有多篇论文聚焦多语言或跨域场景。Baidu 的 Querit-Reranker 通过标签无

AI 技术日报 - 2026-06-19

今日 AI 领域迎来多个里程碑事件:Anthropic 的 Claude Opus 4.7 自主操控机器人速度比人类快 20 倍,标志着 LLM 在物理世界自主性的质变;高通拟 80-100 亿美元收购 Tenstorrent,押注 RISC-V 路线挑战 NVIDIA 推理霸权;Transformer 论文作者之一 Noam Shazeer 加入 OpenAI,Sam Altman 称自 OpenAI 创立之初就希望与其合作。同时,Agent 基础设施全面走向生产级——Amazon Bedrock AgentCore Harness GA、Perplexity 推出 Brain 系统、Kim

推荐算法日报 - 2026-06-18

大模型驱动的推荐系统范式升级:今日多篇论文聚焦于将大型语言模型(LLM)深度融入推荐系统,不再局限于特征工程,而是直接利用LLM进行用户行为序列建模、跨域知识迁移和冷启动物品理解。这表明业界正从“LLM辅助推荐”向“LLM原生推荐”演进,核心挑战在于如何平衡模型容量与推理效率。; 多模态与长序列建模的工程化突破:针对短视频、直播等富媒体场景,业界开始探索更高效的多模态特征融合与用户长期行为序列建模方案。例如,通过解耦注意力机制或记忆网络,在可控的计算成本下,将用户数月的交互历史纳入模型,以捕捉动

AI 技术日报 - 2026-06-18

今日 AI 领域迎来多项重磅动态:Transformer 论文作者之一 Noam Shazeer 离开 Google 加入 OpenAI,标志人才争夺战升级;NVIDIA 与 Inclusion AI 分别开源 550B 和 1T 参数级 Agent 模型,混合架构与推理效率成为焦点;AWS 与 Hugging Face 同日发布 Agent 上下文基础设施(Context 服务与 ARD 协议),Agent 生态从“工具调用”迈向“运行时动态发现”。同时,CMU 挑战 Bitter Lesson 提出 V-pretraining,OpenAI 发布 AI 化学家将药物产率提升 57%,Nat

AI 技术日报 - 2026-06-17

今日 AI 领域迎来历史性并购:SpaceX 以 600 亿美元全股票收购 Cursor,同日 Cursor 发布 Git 替代品 Origin,标志着 AI 编码工具从辅助角色跃升为关键基础设施。模型竞赛白热化:智谱 GLM-5.2 开源 744B 模型登顶智能指数,NVIDIA Nemotron 3 Ultra 以 6 倍推理吞吐引领 Agent 推理,Inclusion AI 发布万亿参数 Ling/Ring 2.6。Agent 安全与效率成焦点:AWS 发布按需安全检测 API,Pine AI 提出可编辑 KV 缓存新范式,Figma 分享 MCP 内部实战案例。

AI 技术日报 - 2026-06-17

今日 AI 领域迎来历史性并购:SpaceX 以 600 亿美元全股票收购 Cursor,成为 2026 年最大创业公司并购案,同日 Cursor 推出 Origin 挑战 GitHub。微软据传正探索用 DeepSeek 替代 OpenAI/Anthropic 以控制 Copilot Cowork 成本,而智谱 GLM-5.2 以 51 分登顶 AI 智能指数,开源 MIT 许可。产业层面,AI 公司 CEO 首次受邀参加 G7 峰会午餐会,标志 AI 正式进入地缘政治核心议程。

推荐算法日报 - 2026-06-17

生成式推荐与多任务架构的深度融合:今日多篇论文(OneRank、OneBar、HoloRec)不约而同地将生成式或Transformer-native架构引入推荐核心环节,从精排到召回,试图用统一的生成式框架替代传统的多阶段级联设计,解决目标碎片化和信息瓶颈问题。; 挖掘被忽视的信号源:负行为与合成先验:工业界正积极从“数据”本身寻找增量。一方面,Beyond Positive Signals 论文系统性地将用户隐式负行为(跳过、低参与度)纳入序列建模,以极低成本带来显著AUC提升;另一方面,S

推荐算法日报 - 2026-06-16

检索增强与自适应优化:今日多篇论文聚焦于优化RAG系统的检索环节,核心趋势是从“固定K值”转向“自适应”。无论是ScoreGate通过双分数统计融合动态决定检索数量,还是ADORE通过迭代检索-评估-扩展优化查询,亦或是TASR提出无需训练的停止规则,都旨在以最小的额外成本(零推理调用或轻量规则)提升检索效率与质量,这对工业级RAG系统降低延迟和成本极具价值。; 生成式推荐的时序与语义融合:以ChronoID为代表,生成式推荐正从“时间无关”的语义ID学习,转向显式注入时间信号。这揭示了现有方法

AI 技术日报 - 2026-06-16

今日 AI 领域生态与工程齐头并进:Anthropic 新隐私政策引发争议,Sakana AI 推出 8 小时深度研究 Agent Marlin,vLLM v0.23.0 全面支持 DeepSeek-V4。OpenAI 投入 1.5 亿美元构建合作伙伴网络,目标培训 30 万认证顾问。AWS 发布 Agent 故障检测工具 Strands Evals Detector,同时 Kubernetes GPU 时间切片隐藏代价被揭示——多 Agent 共享 GPU 时 p99 延迟飙升 66%。论文方面,Microsoft 提出几何诊断方法揭示 LLM-as-Judge 的共享偏差,Amazon 推

AI 技术日报 - 2026-06-15

今日 AI 领域监管与效率两大主题交织:美国当局以安全为由暂停 Anthropic 最先进模型 Fable 5 和 Mythos 5 的访问,联合创始人 Andrej Karpathy 因非美国公民身份被拒接触内部模型,引发对"主权 AI"政策的广泛争议。与此同时,AMD 发布 Ryzen AI Max+ 395,以 128GB 共享内存和 1,499 美元售价实现本地运行 235B 模型,推理性能据称超 RTX 5080 三倍,标志着消费级硬件与云 AI 订阅的性价比拐点。产业层面,Mistral AI 以 200 亿欧元估值融资,欧洲主权 AI 从叙事走向现实;而 'Agentjackin

AI 技术日报 - 2026-06-14

今日 AI 领域地缘政治风险加剧:美国政府直接指令 Anthropic 暂停 Fable 5/Mythos 5 对外国用户访问,出口管制从地域转向个人身份,MiniMax 随即宣布 M3 开源并强硬回应。同时,GitHub 分享 Copilot CLI 委派优化实践,NVIDIA Blackwell 在首个 Agentic AI 基础设施基准 AgentPerf 中领跑,微软 Project Ire Agent 成功自主识别恶意软件变种,Agent 工程正从概念走向生产级精细优化。