推荐算法日报 - 2026-06-03

生成式推荐进入"全栈统一"与"表示优化"深水区:今日多篇论文(UniPinRec、PrefixMem、DRQ)聚焦于生成式推荐(Semantic ID)的工业化落地。趋势从"用LLM生成推荐"转向"如何高效、鲁棒地表示和利用Semantic ID",包括统一检索与排序的全栈架构(UniPinRec)、为SID设计专用编码器(PrefixMem)、以及解耦量化提升鲁棒性(DRQ)。这表明生成式推荐正从概念验证走向大规模系统部署,核心瓶颈已从"能否用"变为"如何用好"。; 跨域/跨模态信号迁移成为工

AI 技术日报 - 2026-06-03

今日 AI 领域迎来多个重磅发布与产业信号:微软发布自研推理模型 MAI-Thinking-1 及 7 个新模型,并推出 Agent Control Specification 开源标准,标志其 AI 战略全面加速。GitHub 发布 Agent-native 桌面控制中心 Copilot app,其 COO 透露 AI Agent 导致代码提交量激增 1400%,基础设施面临新挑战。OpenAI Codex 周活用户突破 500 万,非开发者占比激增,正从编程工具向通用生产力平台演进。同时,Anthropic 将 Project Glasswing 扩展至 15 国关键基础设施,发现超 10

推荐算法日报 - 2026-06-02

Agent 驱动的检索与推理:今日多篇论文探索了 Agent 范式在推荐系统中的应用。DynaTree 利用多 Agent 协作构建离线检索树,实现高效的在线新闻检索;DCRC 则训练一个数据为中心的 Agent 来编译可执行的推理程序,以解决金融 QA 中的数值幻觉问题。这表明 Agent 正在从单纯的对话式交互,向更复杂的、结构化的离线规划与在线执行解耦的方向演进。; 从“模型为中心”到“数据/系统为中心”的范式转移:多篇论文不再单纯优化模型架构,而是从数据或系统层面寻求突破。V-SPLAD

AI 技术日报 - 2026-06-02

今日 AI 领域迎来双重里程碑:Anthropic 正式提交 S-1 启动 IPO,与 OpenAI 展开上市竞赛,标志着产业从融资驱动转向资本市场成熟阶段;同时 MiniMax 发布 M3 模型,在关键基准上超越 GPT-5.5 和 Gemini 3.1 Pro,成本仅为 5-10%,这是中国模型首次在性能上超越美国前沿模型。NVIDIA 发布开源物理 AI 全能模型 Cosmos 3,Runway 与 NVIDIA 成立 Cosmos Coalition 共建开源世界模型。Agent 生态持续进化:Perplexity 推出 Search as Code 新架构,IBM 提出 Agent

AI 技术日报 - 2026-06-01

今日 AI 领域迎来多个重磅发布:MiniMax 开源首个集编码、Agent、1M 上下文与原生多模态的 M3 模型,NVIDIA 正式进军 PC 芯片市场发布 N1X SoC,同时 Sam Altman 宣布 OpenAI Robotics 招聘。产业层面,McKinsey 预测推理计算 2027 年将超过训练,Peter Diamandis 称 Opus 4.8 已超越其设定的 AGI 阈值。Agent 生态持续繁荣,SkillOpt 开源、CC Workflow Studio 上线、Hermes Agent 支持 Windows,AI 正从"能力展示"全面走向"生产级部署"。

AI 技术日报 - 2026-05-31

今日 AI 领域在基础设施与安全实战层面均有重大进展:vLLM v0.22.0 发布,新增 DeepSeek V4 支持与 Cutlass FP8 端到端延迟降低 28.9%;NVIDIA 推出 DynoSim 推理栈模拟器,比真实时间快 1500 倍。安全方面,攻击者首次使用 LLM Agent 进行真实后渗透攻击,全程仅一小时。此外,Qualcomm 与字节跳动达成数据中心 AI 推理 ASIC 定制协议,股价创 52 周新高;Databricks 推出 Model Units 定价模式,将推理成本与 GPU 实例解耦。

AI周报 2026-W22

本周 AI 产业的核心叙事围绕一条主线展开:Agent 从“帮开发者写代码”正式演变为“在后台独立工作”,而支撑这一转变的推理效率、安全评估和资本军备竞赛同步加速。Anthropic 的 Opus 4.8 和 Dynamic Workflows 将并行子 Agent 数量推到数百个,OpenAI 的 Codex 扩展至 Windows 平台并支持移动端远程监控,xAI 也以极低定价推出专长 agentic coding 的 grok-build-0.1——这些都不是“更好的 Tab 补全”,而是让 Agent 以异步队友身份参与开发的新范式。Latent Space 对 Cognition 和 OpenInspect 创始人的访谈系统梳理了从 Copilot (第一波) 到本地 Agent (第二波) 再到异步 Agent (第三波) 的演进,其中 Cursor CEO 提到的“第三时代”在本周被多家实际操作验证。 与范式并行的是资本对 Agent 赛道的押注:Anthropic 完成 965 亿美元 H 轮(估值 9650 亿),营收年化 470 亿;Cognition 以 260 亿估值融得 10 亿美元 D 轮,预计年底 ARR 超 10 亿。模型层同样密集更新——Claude Opus 4.8 在多项编码和 Agent 基准上超越 GPT-5.5,诚实性提升约 4 倍;MiniMax-M2 以 9.8B 激活参数实现 229.9B 总参的 MoE 性能;Qwen-VLA 则将视觉-语言-动作统一进单一模型,在 7 个机器人基准上达到 SOTA。推理效率方面,vLLM 集成 fastokens 用 Rust BPE tokenizer 消除长上下文瓶颈,MobileMoE 在商品手机上实现 1.8–3.8× 加速,Orbit 基础设施(tweet)甚至能在单节点 8×B200 上训练万亿参数模型的 RL。安全侧同样有进展,OpenAI 发布第三方评估共享手册,Redpanda 提出 out-of-band 元数据通道架构用于 Agent 安全治理,Onyx Security 推出企业级 Agent 监控。 以下是四个主题的详细分析。

推荐周报 2026-W22

本周推荐系统研究围绕三条技术主线展开。 工业级知识蒸馏进入迁移率量化时代: 字节跳动、Meta、微软、阿里分别展示了大规模蒸馏框架。字节的Rec-Distill(24B教师、20K序列)实现蒸馏迁移率>60%,阿里GPlan将LLM推理压缩为隐式token,Meta的LoopFM通过结构化中间表示让蒸馏迁移率翻倍,微软HARNESS-LM以190M参数恢复教师98%精度。四篇的共同指向是——蒸馏已经不只是模型压缩手段,而是把大模型能力“货币化”为可量化的业务指标。 生成式推荐从项目生成走向意图序列与条件生成: 阿里QGS在Quark搜索部署conditional next-item预测,Netflix揭示1B参数生成式推荐中不同任务的缩放天花板,清华SID碰撞分析发现Hit@10被高估103%。三篇共同说明——生成式推荐正在进入精细化评估和条件控制阶段。 推荐系统缩放从“堆参数”转向多维协同与测试时计算: Coupang系统研究CVR模型在骨干、嵌入、数据三个维度的可加缩放效应;阿里UTTSI首次将test-time compute引入CTR,无模型修改下CTR提升5.3%;Meta的rank-aware decomposition使DLRM吞吐量提升87.5%。缩放的核心矛盾已从“能不能大”变为“怎么用得巧”。

推荐算法日报 - 2026-05-30

大模型知识迁移与蒸馏成为工业界核心战场:今日多篇工业界论文(阿里GPlan、字节Rec-Distill、Meta LoopFM)聚焦于如何将大模型(LLM或Foundation Model)的推理能力或表征知识高效迁移至轻量级服务模型。核心创新点从传统的标量蒸馏转向结构化知识(如隐式推理token、中间层嵌入、历史表示)的传递,旨在突破知识迁移率瓶颈,实现线上部署的精度与延迟平衡。; 推荐系统进入“生成式”与“规划”时代:以阿里GPlan为代表,推荐任务正从“预测下一个点击”向“生成并规划一个意

AI 技术日报 - 2026-05-30

今日 AI 领域迎来格局性转折:Anthropic 以 9650 亿美元估值超越 OpenAI,并发布 Claude Opus 4.8 与动态工作流,预告 Mythos 模型即将上线。同时,xAI 发布 grok-build-0.1 API 公测,Step 3.7 Flash 在多平台上线,Cursor 推出 auto-review 模式。论文方面,Anthropic 首次将稀疏自编码器成功扩展到生产级模型 Claude 3 Sonnet,Meta 提出利用历史 FM 中间表示进行知识蒸馏的 LoopFM 框架。开源社区方面,DeepSWE 编程 Agent 基准发布,vLLM 集成 fast

推荐算法日报 - 2026-05-29

LLM 从辅助信号走向核心排序引擎:今日多篇论文(MixRAGRec, LRanker, DoorDash)展示了 LLM 从离线生成标签、辅助特征,到直接参与召回和精排的演进。核心挑战在于如何在大规模候选集和低延迟约束下,高效利用 LLM 的语义理解能力,而非简单替换现有模型。; 推理优化成为工业落地关键:Meta 的秩感知分解和 Pinterest 的 LLM 辅助预测器,都指向一个共同目标——在不牺牲效果的前提下,大幅降低计算成本。这表明,当学术界在探索 LLM 的潜力时,工业界更关注如何

AI 技术日报 - 2026-05-29

今日 AI 领域迎来历史性转折:Anthropic 以 9650 亿美元估值超越 OpenAI,完成 650 亿美元 H 轮融资,同步发布旗舰模型 Claude Opus 4.8,在编码和 Agent 基准上全面领先。融资与产品双线突破标志着竞争格局的深刻变化。与此同时,Step 3.7 Flash 以 198B MoE 开源、SpaceX 自研 C 语言训练栈声称比 JAX 快 10 倍、Meta 发布推荐系统新范式 SilverTorch,技术路线呈现多元化。Agent 安全与工程实践成为焦点——华为 BeSafe-Bench 揭示所有主流 Agent 安全完成率不足 40%,AWS 分享

1
...
34567
...
21