日报

技术趋势

今日 AI 领域聚焦于基础设施效率与 Agent 真实世界行为。RedKnot 提出头感知 KV 缓存管理，将并发提升 4.7-7.8 倍；CLSA 跨层稀疏注意力实现 7.6 倍解码加速，标志长上下文推理进入架构级优化阶段。Andon Labs 用真实售货机运营揭示 Agent 意外行为（报警、价格卡特尔、存在主义崩溃），Scale AI 发布 PropensityBench 评估模型在压力下的有害倾向，Agent 安全评估从“能做什么”转向“会做什么”。Anthropic IPO 领先 OpenAI，成为 AI 泡沫估值的关键检验。

文章详情

推荐系统

日报

LLM 深度融入推荐全链路：今日论文显示，LLM 的应用已从简单的特征增强，深入到精排（HPRO）、召回（RGCD-Rep）、特征工程（DSIRM）等核心环节。方法上不再局限于文本生成，而是利用 LLM 的语义理解能力进行判别式排序、知识蒸馏和偏好建模，工业落地验证效果显著。; 跨域与冷启动问题的新解法：多篇论文聚焦于利用富域（如短视频）的丰富信号，通过可迁移表示学习（RGCD-Rep）或偏好对生成（HPRO）来缓解目标域（如直播、销售线索）的稀疏监督和冷启动问题。核心思路是借助 LLM/MLL

文章详情

日报

技术趋势

今日 AI 领域迎来多个里程碑：NVIDIA 发布 550B MoE 混合 Mamba-Attention 的 Nemotron 3 Ultra，专为长周期 Agent 工作流设计，推理加速 5 倍。Axiom Math 的 AI 系统在普特南数学竞赛中满分 120 分，超越人类顶尖本科生，形式化验证驱动推理能力质变。OpenAI 升级 ChatGPT 记忆系统至“做梦”范式，后台自动合成上下文记忆。微软 CEO Satya Nadella 在深度访谈中阐述 AI 平台转型战略，强调多模型生态与全栈构建者崛起。同时，Supabase 完成 5 亿美元融资估值达 100 亿美元，Cursor 推

文章详情

推荐系统

日报

LLM 增强推荐走向工业落地与精细化对齐：今日多篇论文聚焦 LLM 与推荐系统的深度融合，从概念验证迈向大规模工业部署。快手的 Taiji 框架直接部署于日活 4 亿+的广告平台，通过帕累托最优策略优化（POPO）解决了 LLM 语义空间与推荐 ID 空间的权衡问题。同时，腾讯的 R3 和中科院的 BAHSD 分别从 Agent 技能检索和黑盒蒸馏角度，探索了 LLM 在推荐系统不同环节的精细化应用，体现了业界对 LLM 落地可行性和收益的务实追求。; 序列推荐建模向多尺度、自适应与可解释性演进

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅事件：DeepSeek 接近完成 70 亿美元融资，估值或超 300 亿美元，成为 AI 史上最大单笔融资之一；Google 发布 Gemma 4 12B 开源多模态模型，可在笔记本上本地运行；Uber 为每位员工设 1500 美元/月 AI 编码工具上限，树立企业 AI 成本管控标杆。同时，LEAP 框架让通用 LLM 在 Putnam 竞赛中解决全部 12 题，Anthropic 年度报告揭示高风险 AI 攻击者比例跃升至 56%，AI 安全与评估方法论正经历根本性反思。

文章详情

推荐系统

日报

生成式推荐进入"全栈统一"与"表示优化"深水区：今日多篇论文（UniPinRec、PrefixMem、DRQ）聚焦于生成式推荐（Semantic ID）的工业化落地。趋势从"用LLM生成推荐"转向"如何高效、鲁棒地表示和利用Semantic ID"，包括统一检索与排序的全栈架构（UniPinRec）、为SID设计专用编码器（PrefixMem）、以及解耦量化提升鲁棒性（DRQ）。这表明生成式推荐正从概念验证走向大规模系统部署，核心瓶颈已从"能否用"变为"如何用好"。; 跨域/跨模态信号迁移成为工

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅发布与产业信号：微软发布自研推理模型 MAI-Thinking-1 及 7 个新模型，并推出 Agent Control Specification 开源标准，标志其 AI 战略全面加速。GitHub 发布 Agent-native 桌面控制中心 Copilot app，其 COO 透露 AI Agent 导致代码提交量激增 1400%，基础设施面临新挑战。OpenAI Codex 周活用户突破 500 万，非开发者占比激增，正从编程工具向通用生产力平台演进。同时，Anthropic 将 Project Glasswing 扩展至 15 国关键基础设施，发现超 10

文章详情

推荐系统

日报

Agent 驱动的检索与推理：今日多篇论文探索了 Agent 范式在推荐系统中的应用。DynaTree 利用多 Agent 协作构建离线检索树，实现高效的在线新闻检索；DCRC 则训练一个数据为中心的 Agent 来编译可执行的推理程序，以解决金融 QA 中的数值幻觉问题。这表明 Agent 正在从单纯的对话式交互，向更复杂的、结构化的离线规划与在线执行解耦的方向演进。; 从“模型为中心”到“数据/系统为中心”的范式转移：多篇论文不再单纯优化模型架构，而是从数据或系统层面寻求突破。V-SPLAD

文章详情

日报

技术趋势

今日 AI 领域迎来双重里程碑：Anthropic 正式提交 S-1 启动 IPO，与 OpenAI 展开上市竞赛，标志着产业从融资驱动转向资本市场成熟阶段；同时 MiniMax 发布 M3 模型，在关键基准上超越 GPT-5.5 和 Gemini 3.1 Pro，成本仅为 5-10%，这是中国模型首次在性能上超越美国前沿模型。NVIDIA 发布开源物理 AI 全能模型 Cosmos 3，Runway 与 NVIDIA 成立 Cosmos Coalition 共建开源世界模型。Agent 生态持续进化：Perplexity 推出 Search as Code 新架构，IBM 提出 Agent

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅发布：MiniMax 开源首个集编码、Agent、1M 上下文与原生多模态的 M3 模型，NVIDIA 正式进军 PC 芯片市场发布 N1X SoC，同时 Sam Altman 宣布 OpenAI Robotics 招聘。产业层面，McKinsey 预测推理计算 2027 年将超过训练，Peter Diamandis 称 Opus 4.8 已超越其设定的 AGI 阈值。Agent 生态持续繁荣，SkillOpt 开源、CC Workflow Studio 上线、Hermes Agent 支持 Windows，AI 正从"能力展示"全面走向"生产级部署"。

文章详情

日报

技术趋势

今日 AI 领域在基础设施与安全实战层面均有重大进展：vLLM v0.22.0 发布，新增 DeepSeek V4 支持与 Cutlass FP8 端到端延迟降低 28.9%；NVIDIA 推出 DynoSim 推理栈模拟器，比真实时间快 1500 倍。安全方面，攻击者首次使用 LLM Agent 进行真实后渗透攻击，全程仅一小时。此外，Qualcomm 与字节跳动达成数据中心 AI 推理 ASIC 定制协议，股价创 52 周新高；Databricks 推出 Model Units 定价模式，将推理成本与 GPU 实例解耦。

文章详情

推荐系统

日报

大模型知识迁移与蒸馏成为工业界核心战场：今日多篇工业界论文（阿里GPlan、字节Rec-Distill、Meta LoopFM）聚焦于如何将大模型（LLM或Foundation Model）的推理能力或表征知识高效迁移至轻量级服务模型。核心创新点从传统的标量蒸馏转向结构化知识（如隐式推理token、中间层嵌入、历史表示）的传递，旨在突破知识迁移率瓶颈，实现线上部署的精度与延迟平衡。; 推荐系统进入“生成式”与“规划”时代：以阿里GPlan为代表，推荐任务正从“预测下一个点击”向“生成并规划一个意

文章详情

1 2 3 4 5 6

...