本周推荐系统研究集中在三个方向:大规模图检索的全生命周期协同设计、基于Transformer的序列建模在多平台落地、以及多任务排序架构从DNN向Transformer native的迁移。Meta、Airbnb、Alibaba、Shopee、NetEase Cloud Music等公司各自发布了线上部署工作,提供具体的AB指标。 主线1(大规模图系统的端到端设计): Meta的RankGraph-2(Meta)将图构建、表示学习、在线服务三个阶段耦合优化,在百亿节点图上计算成本降低83%、召回率是GAT+Deep Graph Infomax的3.8倍、线上CTR+0.96%、CVR+2.75%。同方向,HighLevel的ScoreGate(HighLevel)用双分数统计融合控制RAG检索数量,生产环境减少34.8% token、召回率97.77-99.34%。 主线2(生成式推荐从理论走向生产): Airbnb的JourneyFormer(Airbnb)在搜索排序中部署基于Transformer的序列模型,处理长且稀疏的用户行为;阿里巴巴的OneBar(Alibaba)用端到端生成式框架做视频电商查询推荐,GMV提升21.67%。两篇共同指向——生成式推荐需要在实际约束(冷启动、延迟、标签稀疏)下做工程折中,而非单纯追求离线指标。 主线3(多任务排序的Transformer-native范式): Shopee的OneRank(Shopee)消除编码器-预测器分离,在Transformer内部做任务私有通道和梯度分离,线上CTR+1.2%、CVR+0.8%。网易云音乐的PIANO(NetEase Cloud Music)用可学习[CLS] token实现列表级多目标重排,CTR+0.62%、CVR+4.45%。两者都说明:将多目标推理内化到Transformer堆中比外挂MLP更有效。
今日 AI 领域迎来多个关键节点:DeepSeek 开源 1.6T 参数的 V4 系列模型,在百万 token 上下文中实现 3.7 倍 FLOPs 降低,多项基准超越 GPT-5.4 和 Claude Opus 4.6。同时,Subquadratic 公司声称突破 Transformer 注意力 O(n²) 瓶颈,获 MIT Tech Review 深度报道,但模型尚未公开引发业界观望。GLM-5.2 获 Jeremy Howard 等社区领袖认可,成为首个在日常使用中接近前沿水平的开源模型。此外,GitHub 分享了内部数据分析 Agent Qubot 的完整构建经验,CMU 的 TheA
今日 AI 领域迎来多个里程碑事件:Anthropic 的 Claude Opus 4.7 自主操控机器人速度比人类快 20 倍,标志着 LLM 在物理世界自主性的质变;高通拟 80-100 亿美元收购 Tenstorrent,押注 RISC-V 路线挑战 NVIDIA 推理霸权;Transformer 论文作者之一 Noam Shazeer 加入 OpenAI,Sam Altman 称自 OpenAI 创立之初就希望与其合作。同时,Agent 基础设施全面走向生产级——Amazon Bedrock AgentCore Harness GA、Perplexity 推出 Brain 系统、Kim
今日 AI 领域迎来多项重磅动态:Transformer 论文作者之一 Noam Shazeer 离开 Google 加入 OpenAI,标志人才争夺战升级;NVIDIA 与 Inclusion AI 分别开源 550B 和 1T 参数级 Agent 模型,混合架构与推理效率成为焦点;AWS 与 Hugging Face 同日发布 Agent 上下文基础设施(Context 服务与 ARD 协议),Agent 生态从“工具调用”迈向“运行时动态发现”。同时,CMU 挑战 Bitter Lesson 提出 V-pretraining,OpenAI 发布 AI 化学家将药物产率提升 57%,Nat
今日 AI 领域生态与工程齐头并进:Anthropic 新隐私政策引发争议,Sakana AI 推出 8 小时深度研究 Agent Marlin,vLLM v0.23.0 全面支持 DeepSeek-V4。OpenAI 投入 1.5 亿美元构建合作伙伴网络,目标培训 30 万认证顾问。AWS 发布 Agent 故障检测工具 Strands Evals Detector,同时 Kubernetes GPU 时间切片隐藏代价被揭示——多 Agent 共享 GPU 时 p99 延迟飙升 66%。论文方面,Microsoft 提出几何诊断方法揭示 LLM-as-Judge 的共享偏差,Amazon 推