推荐系统

日报

生成式推荐进入"全栈统一"与"表示优化"深水区：今日多篇论文（UniPinRec、PrefixMem、DRQ）聚焦于生成式推荐（Semantic ID）的工业化落地。趋势从"用LLM生成推荐"转向"如何高效、鲁棒地表示和利用Semantic ID"，包括统一检索与排序的全栈架构（UniPinRec）、为SID设计专用编码器（PrefixMem）、以及解耦量化提升鲁棒性（DRQ）。这表明生成式推荐正从概念验证走向大规模系统部署，核心瓶颈已从"能否用"变为"如何用好"。; 跨域/跨模态信号迁移成为工

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅发布与产业信号：微软发布自研推理模型 MAI-Thinking-1 及 7 个新模型，并推出 Agent Control Specification 开源标准，标志其 AI 战略全面加速。GitHub 发布 Agent-native 桌面控制中心 Copilot app，其 COO 透露 AI Agent 导致代码提交量激增 1400%，基础设施面临新挑战。OpenAI Codex 周活用户突破 500 万，非开发者占比激增，正从编程工具向通用生产力平台演进。同时，Anthropic 将 Project Glasswing 扩展至 15 国关键基础设施，发现超 10

文章详情

推荐系统

日报

Agent 驱动的检索与推理：今日多篇论文探索了 Agent 范式在推荐系统中的应用。DynaTree 利用多 Agent 协作构建离线检索树，实现高效的在线新闻检索；DCRC 则训练一个数据为中心的 Agent 来编译可执行的推理程序，以解决金融 QA 中的数值幻觉问题。这表明 Agent 正在从单纯的对话式交互，向更复杂的、结构化的离线规划与在线执行解耦的方向演进。; 从“模型为中心”到“数据/系统为中心”的范式转移：多篇论文不再单纯优化模型架构，而是从数据或系统层面寻求突破。V-SPLAD

文章详情

日报

技术趋势

今日 AI 领域迎来双重里程碑：Anthropic 正式提交 S-1 启动 IPO，与 OpenAI 展开上市竞赛，标志着产业从融资驱动转向资本市场成熟阶段；同时 MiniMax 发布 M3 模型，在关键基准上超越 GPT-5.5 和 Gemini 3.1 Pro，成本仅为 5-10%，这是中国模型首次在性能上超越美国前沿模型。NVIDIA 发布开源物理 AI 全能模型 Cosmos 3，Runway 与 NVIDIA 成立 Cosmos Coalition 共建开源世界模型。Agent 生态持续进化：Perplexity 推出 Search as Code 新架构，IBM 提出 Agent

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅发布：MiniMax 开源首个集编码、Agent、1M 上下文与原生多模态的 M3 模型，NVIDIA 正式进军 PC 芯片市场发布 N1X SoC，同时 Sam Altman 宣布 OpenAI Robotics 招聘。产业层面，McKinsey 预测推理计算 2027 年将超过训练，Peter Diamandis 称 Opus 4.8 已超越其设定的 AGI 阈值。Agent 生态持续繁荣，SkillOpt 开源、CC Workflow Studio 上线、Hermes Agent 支持 Windows，AI 正从"能力展示"全面走向"生产级部署"。

文章详情

日报

技术趋势

今日 AI 领域在基础设施与安全实战层面均有重大进展：vLLM v0.22.0 发布，新增 DeepSeek V4 支持与 Cutlass FP8 端到端延迟降低 28.9%；NVIDIA 推出 DynoSim 推理栈模拟器，比真实时间快 1500 倍。安全方面，攻击者首次使用 LLM Agent 进行真实后渗透攻击，全程仅一小时。此外，Qualcomm 与字节跳动达成数据中心 AI 推理 ASIC 定制协议，股价创 52 周新高；Databricks 推出 Model Units 定价模式，将推理成本与 GPU 实例解耦。

文章详情

周报

技术趋势

本周 AI 产业的核心叙事围绕一条主线展开：Agent 从“帮开发者写代码”正式演变为“在后台独立工作”，而支撑这一转变的推理效率、安全评估和资本军备竞赛同步加速。Anthropic 的 Opus 4.8 和 Dynamic Workflows 将并行子 Agent 数量推到数百个，OpenAI 的 Codex 扩展至 Windows 平台并支持移动端远程监控，xAI 也以极低定价推出专长 agentic coding 的 grok-build-0.1——这些都不是“更好的 Tab 补全”，而是让 Agent 以异步队友身份参与开发的新范式。Latent Space 对 Cognition 和 OpenInspect 创始人的访谈系统梳理了从 Copilot (第一波) 到本地 Agent (第二波) 再到异步 Agent (第三波) 的演进，其中 Cursor CEO 提到的“第三时代”在本周被多家实际操作验证。与范式并行的是资本对 Agent 赛道的押注：Anthropic 完成 965 亿美元 H 轮（估值 9650 亿），营收年化 470 亿；Cognition 以 260 亿估值融得 10 亿美元 D 轮，预计年底 ARR 超 10 亿。模型层同样密集更新——Claude Opus 4.8 在多项编码和 Agent 基准上超越 GPT-5.5，诚实性提升约 4 倍；MiniMax-M2 以 9.8B 激活参数实现 229.9B 总参的 MoE 性能；Qwen-VLA 则将视觉-语言-动作统一进单一模型，在 7 个机器人基准上达到 SOTA。推理效率方面，vLLM 集成 fastokens 用 Rust BPE tokenizer 消除长上下文瓶颈，MobileMoE 在商品手机上实现 1.8–3.8× 加速，Orbit 基础设施（tweet）甚至能在单节点 8×B200 上训练万亿参数模型的 RL。安全侧同样有进展，OpenAI 发布第三方评估共享手册，Redpanda 提出 out-of-band 元数据通道架构用于 Agent 安全治理，Onyx Security 推出企业级 Agent 监控。以下是四个主题的详细分析。

本周推荐系统研究围绕三条技术主线展开。工业级知识蒸馏进入迁移率量化时代：字节跳动、Meta、微软、阿里分别展示了大规模蒸馏框架。字节的Rec-Distill（24B教师、20K序列）实现蒸馏迁移率>60%，阿里GPlan将LLM推理压缩为隐式token，Meta的LoopFM通过结构化中间表示让蒸馏迁移率翻倍，微软HARNESS-LM以190M参数恢复教师98%精度。四篇的共同指向是——蒸馏已经不只是模型压缩手段，而是把大模型能力“货币化”为可量化的业务指标。生成式推荐从项目生成走向意图序列与条件生成：阿里QGS在Quark搜索部署conditional next-item预测，Netflix揭示1B参数生成式推荐中不同任务的缩放天花板，清华SID碰撞分析发现Hit@10被高估103%。三篇共同说明——生成式推荐正在进入精细化评估和条件控制阶段。推荐系统缩放从“堆参数”转向多维协同与测试时计算： Coupang系统研究CVR模型在骨干、嵌入、数据三个维度的可加缩放效应；阿里UTTSI首次将test-time compute引入CTR，无模型修改下CTR提升5.3%；Meta的rank-aware decomposition使DLRM吞吐量提升87.5%。缩放的核心矛盾已从“能不能大”变为“怎么用得巧”。

文章详情

推荐系统

日报

大模型知识迁移与蒸馏成为工业界核心战场：今日多篇工业界论文（阿里GPlan、字节Rec-Distill、Meta LoopFM）聚焦于如何将大模型（LLM或Foundation Model）的推理能力或表征知识高效迁移至轻量级服务模型。核心创新点从传统的标量蒸馏转向结构化知识（如隐式推理token、中间层嵌入、历史表示）的传递，旨在突破知识迁移率瓶颈，实现线上部署的精度与延迟平衡。; 推荐系统进入“生成式”与“规划”时代：以阿里GPlan为代表，推荐任务正从“预测下一个点击”向“生成并规划一个意

文章详情

日报

技术趋势

今日 AI 领域迎来格局性转折：Anthropic 以 9650 亿美元估值超越 OpenAI，并发布 Claude Opus 4.8 与动态工作流，预告 Mythos 模型即将上线。同时，xAI 发布 grok-build-0.1 API 公测，Step 3.7 Flash 在多平台上线，Cursor 推出 auto-review 模式。论文方面，Anthropic 首次将稀疏自编码器成功扩展到生产级模型 Claude 3 Sonnet，Meta 提出利用历史 FM 中间表示进行知识蒸馏的 LoopFM 框架。开源社区方面，DeepSWE 编程 Agent 基准发布，vLLM 集成 fast

文章详情

推荐系统

日报

LLM 从辅助信号走向核心排序引擎：今日多篇论文（MixRAGRec, LRanker, DoorDash）展示了 LLM 从离线生成标签、辅助特征，到直接参与召回和精排的演进。核心挑战在于如何在大规模候选集和低延迟约束下，高效利用 LLM 的语义理解能力，而非简单替换现有模型。; 推理优化成为工业落地关键：Meta 的秩感知分解和 Pinterest 的 LLM 辅助预测器，都指向一个共同目标——在不牺牲效果的前提下，大幅降低计算成本。这表明，当学术界在探索 LLM 的潜力时，工业界更关注如何

文章详情

日报

技术趋势

今日 AI 领域迎来历史性转折：Anthropic 以 9650 亿美元估值超越 OpenAI，完成 650 亿美元 H 轮融资，同步发布旗舰模型 Claude Opus 4.8，在编码和 Agent 基准上全面领先。融资与产品双线突破标志着竞争格局的深刻变化。与此同时，Step 3.7 Flash 以 198B MoE 开源、SpaceX 自研 C 语言训练栈声称比 JAX 快 10 倍、Meta 发布推荐系统新范式 SilverTorch，技术路线呈现多元化。Agent 安全与工程实践成为焦点——华为 BeSafe-Bench 揭示所有主流 Agent 安全完成率不足 40%，AWS 分享

文章详情

...

3 4 5 6 7

...