日报

技术趋势

今日 AI 领域迎来多项重磅进展：DeepSeek V4 发布 DSpark 推测解码框架，推理速度提升 80% 并全栈开源；SubQ 模型以 56 倍注意力加速挑战长上下文瓶颈；Grok 4.5 进入 SpaceX/Tesla 私有测试，GLM-5.2 以 1/6 成本击败 GPT-5.5 引发企业后训练热潮。苹果 Xcode 26.3 原生集成 Agentic Coding，微软 73 亿美元 Fairwater AI 园区启用，AI 基础设施与开发工具正全面走向生产级。

文章详情

推荐系统

日报

[Agent + LLM 驱动推荐系统自动化]：从架构演化到特征筛选，工业界正系统性地引入 LLM Agent 来替代人工专家。腾讯的 NOVA 框架展示了 Agent 如何自动化完成“论文到生产”的模型升级，PayPal 的 EMA-FS 则用增益感知的筛选策略加速 GBDT 训练。核心趋势是从“调参自动化”走向“架构决策自动化”，但验证和风险控制（如 NOVA 的验证级联）是落地的关键。; [归因与增量性：从“归因”到“归因校正”]：广告归因领域正从简单的“最后一次点击”或“多触点归因”转向

文章详情

日报

技术趋势

今日 AI 领域迎来里程碑式发布：OpenAI 正式预览 GPT-5.6 Sol，采用全新架构并支持 1M 上下文，但发布过程罕见地被美国政府干预，需商务部逐客户审批放行，标志着前沿模型监管进入新阶段。与此同时，智谱 AI 开源模型 GLM-5.2 在编码能力上首次超越 GPT-5.5，成本仅为其 1/6，开源社区迎来重要拐点。产业层面，Stripe 分享了年处理 1.4 万亿美元交易的生产级 Agent 架构，快手开源 AgentX 多智能体系统实现超 1 亿年化收入，AI 从能力展示正式进入规模化价值兑现期。

文章详情

推荐系统

日报

生成式推荐进入工业落地爆发期：今日多篇论文（TokenMinds、RaG）将生成式推荐从概念验证推向大规模工业部署。核心趋势是使用统一的Semantic ID (SID) 体系同时表示用户和物品，实现跨场景（长/短视频）的统一建模，并显著降低训练和服务成本。这标志着生成式推荐正从“召回”环节向“排序”和“内容生成”全链路渗透。; 零样本与自适应推理成为降本增效新焦点：面对海量动态物品和复杂查询，工业系统开始探索更智能的资源分配策略。IRENE通过元分类器为未见物品即时合成分类器，解决零样本检索难

文章详情

日报

技术趋势

今日 AI 领域迎来多个里程碑：OpenAI 发布 Agent 经济报告，揭示 Codex 占内部输出 token 的 99.8%，非开发者采用增长 137x；SWE-bench Pro 发布，因旧基准 59.4% 测试用例存在缺陷，Coding Agent 评测标准迎来根本性更新。同时，Sail 获 8000 万美元融资构建长时 Agent 推理基础设施，PimDeWitte 获 3.2 亿美元融资用于世界模型数据采集，标志 Agent 基础设施投资进入爆发期。Notion 集成 Claude 和 Cursor 作为外部 Agent，从生产力工具转型为 AI 编排中枢。

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅事件：OpenAI 与 Broadcom 发布首款 LLM 推理芯片 'Jalapeño'，推理吞吐提升 4 倍；Cursor 在 Colossus 上从零训练 1.5 万亿参数前沿模型，应用层公司自研模型趋势加速；Qualcomm 豪掷 140 亿美元收购 Modular 和 Tenstorrent，挑战 NVIDIA CUDA 垄断。同时，NVIDIA 发布 DFlash 投机解码实现 15 倍推理加速，Google 在 Gemini 3.5 Flash 中推出原生 Computer Use 工具，MCP 协议迎来最大结构更新转向 Stateless 设计。Ag

文章详情

推荐系统

日报

LLM 蒸馏替代点击信号，重塑工业级召回训练范式：今日两篇来自 Walmart 的工业论文均采用 LLM 作为教师模型，生成结构化标注（相关性或意图），替代传统点击信号来训练双塔召回模型。这解决了点击信号中的位置偏差和长尾稀疏问题，并展示了显著的线上收益，标志着工业界正从“数据驱动”向“模型生成数据驱动”的范式转变。; 图基础模型（GFM）评估趋于理性，PFN 范式或成新方向：学术界对 GFM 的评估揭示了其并非普遍优于传统 GNN。只有基于 Prior-data Fitted Networks

文章详情

日报

技术趋势

今日 AI 领域迎来多个里程碑：OpenAI 的 GPT-5 破解三年免疫学谜题，展示了从数据分析到假说生成的科学发现能力；Anthropic 发布 Claude Tag，将 AI 深度集成到 Slack 作为团队持久成员，被 Andrej Karpathy 称为 LLM UI/UX 的第三大范式变革。智谱 GLM-5.2 被推为世界顶级开源模型，母公司 Zai IPO 股价 120 港元。同时，Apple 研究揭示 LLM-as-Judge 评估面板存在“统计幻觉”，Sakana Fugu 发布即遭独立测试质疑，引发对基准测试与真实世界鸿沟的讨论。在效率方面，vLLM 集成 DFlash 投

文章详情

日报

技术趋势

今日 AI 领域安全议题占据核心：五眼联盟联合警告 AI 数月内可发动毁灭性网络攻击，OpenAI 发布 GPT-5.5-Cyber 并推出安全修复工具，Latent Space 播客深度探讨 Mythos 时代红队测试。Cursor 宣布与 SpaceX 联合训练新模型，Perplexity CEO 预测多万亿参数开源模型即将到来。技术层面，LMSYS 联合 NVIDIA 用 SGLang 在 GB300 服务 DeepSeek-V4 实现 5 倍吞吐量提升，Amazon 首次公开 30B 模型自主后训练系统。

文章详情

日报

技术趋势

今日 AI 安全领域爆出重大漏洞：AgentJacking 攻击利用公开的 Sentry 密钥即可劫持 Claude Code、Cursor 等编码 Agent，引发 Agent 供应链安全警报。与此同时，Tesla 提交“MEGAPOD”商标，暗示将 Supercharger 网络转化为分布式 AI 计算平台，边缘计算基础设施迎来新思路。宏观层面，AI 巨头因数据中心巨额支出转向债务融资，2026 年资本支出预计达 7500 亿美元，债券市场正成为科技投资者的新关注焦点。

文章详情

日报

技术趋势

今日 AI 领域聚焦于智能体（Agent）的架构设计与落地原则。Google DeepMind 发布 57 页 ASI 路线图，首次正式定义超级人工智能，并指出硅基智能的固有优势。LlamaIndex CEO 提出 Agent 应使用类似 Google Docs 的双向可编辑文档格式，推动人机协作范式演进。HERE 则提出 LLM 空间推理不应近似计算，应完全卸载给专用执行层，为 Agent 与物理世界交互提供了关键设计原则。此外，一篇系统讲解 Triton 矩阵乘实现的教程，为 LLM 推理优化提供了从入门到实战的优质资源。

文章详情

推荐系统

日报

[大模型适配与效率优化]：今日多篇论文聚焦于如何将大模型（LLM/MLLM）高效应用于推荐与检索系统。核心思路包括将传统信号压缩为“软Token”以适配Transformer架构（Token Factory），以及通过磁盘存储+稀疏过滤（Stellar）或语义缓存校准（Closing the Calibration Gap）来降低推理和检索阶段的内存与计算开销。这表明工业界正从“能否用大模型”转向“如何低成本、高效率地用大模型”。; [多模态检索的冷启动与细粒度问题]：多模态检索是今日另一热点，

文章详情

1 2 3 4 5 6

...