推荐算法日报 - 2026-05-14

[LLM Agent 与推荐系统深度融合]:今日多篇论文聚焦于将LLM Agent的能力引入推荐系统,从简单的序列匹配转向交互式、推理驱动的推荐。TwiSTAR通过自适应推理分配(快慢思考)和工具调用(检索、排序、推理)来提升生成式推荐的精度与效率;RecRM-Bench则系统性地定义了Agent推荐系统的多维奖励建模(指令遵循、事实一致性、相关性、行为预测),为RL优化提供了标准化基准。这表明,将LLM的规划、推理和工具使用能力融入推荐全链路是当前的重要趋势。; [推荐系统中的偏差识别与去偏方

AI 技术日报 - 2026-05-13

今日日报跨越了博客、GitHub 项目、论文和 KOL 推文等多个数据源。核心亮点是:实时语音交互模型取得重大突破(Thinking Machines 发布 TML-Interaction-Small),同时 AI 领域的资本运作和商业竞争持续升温(Cerebras IPO、Anthropic 融资、OpenAI 重谈微软协议)。此外,开源生态的成本结构、多智能体框架和推理优化也是今日热点。 *数据统计: 精选文章 5 篇、GitHub 项目 5 个、论文 0 篇、KOL 推文 27 条

推荐算法日报 - 2026-05-13

[LLM与推荐系统的深度融合]:今日多篇论文聚焦于将LLM能力注入推荐系统,从生成式推荐(LASAR)、多模态理解(ByteDance框架)到个性化知识发现(PDR)和组推荐(AgentGR),LLM正从辅助工具演变为推荐核心引擎。趋势在于利用LLM的推理和语义理解能力,解决传统模型在细粒度偏好建模、复杂决策模拟和内容理解上的瓶颈。; [系统-模型协同优化成为主流]:Meta的LoKA和Xiaohongshu的CCD-Level框架表明,单纯优化模型或系统已无法满足大规模部署需求。LoKA通过F

AI 技术日报 - 2026-05-12

今日日报跨越博客、GitHub、论文、KOL 推文和播客五大数据源,核心亮点是 AI 基础设施正从“训练优先”向“推理优先”加速转变。Stratechery 的长文系统性地剖析了推理工作负载的独特性,而 OpenAI 推出 Daybreak 安全产品与 Deployment Company、AWS 上线原生 Claude 平台、以及多个 Agent 框架(Hugging Face Skills、UI-TARS)的发布,共同指向 AI 应用部署与 Agent 生态的成熟化。此外,Ilya Sutskever 在庭审中的证词与 Epoch AI 对 FrontierMath 基准的修正,也为行业带

推荐算法日报 - 2026-05-12

LLM 驱动推荐系统进入精细化阶段:今日多篇论文聚焦如何更高效、更精准地将LLM融入推荐流程。从利用LLM生成可解释的用户画像(BLUE),到用强化学习(GRPO)优化检索策略(RRCM),再到双通道解耦语义与行为(DCGL),趋势已从“能否用LLM”转向“如何用好LLM”,尤其关注稀疏场景和跨域泛化。; 对现有基准评估体系的反思与重构:多篇论文揭示了当前推荐基准的局限性。Meta的论文通过简单图启发式方法,指出许多基准存在“捷径可解性”,模型的高分可能并非源于其声称的复杂能力。同时,TRACE

AI 技术日报 - 2026-05-11

今日日报跨越博客文章、GitHub 项目、KOL 推文三大数据源。核心亮点是 Agent 基础设施的全面爆发:从 Anthropic 官方发布的标准化技能包,到开源社区涌现的自我改进代理框架和记忆层,再到 GPU 编程的 Rust 化探索,AI 正从“对话工具”加速迈向“可编程、可记忆、可自主行动”的生产力实体。此外,成本优化(如用开源替代高价订阅)和本地化部署(如制造业的 AMD MI300X 方案)成为重要实践方向。 *数据统计: 精选文章 3 篇、GitHub 项目 5 个、KOL 推文 12 条。

AI 技术日报 - 2026-05-10

今日日报跨越博客、GitHub 项目、X 推文三大数据源。核心亮点是 AI Agent 生态的全面爆发:从政策框架到开源框架,从官方 SDK 到自进化机制,Agent 正在从概念走向工程化落地。同时,芯片层(Cerebras IPO、InP 衬底短缺)和模型层(ERNIE 5.1、MiniCPM-o 4.5)也有重要进展。精选文章 1 篇、GitHub 项目 5 个、KOL 推文 22 条。

推荐周报 2026-W19

本周 22 篇论文里能看出两条主线:生成式推荐继续在 Semantic ID 这一层做深耕,检索 / agentic search 这条线则在重写检索接口本身。另有三篇围绕 RAG 工程化(合成表格扩散、自动化 RAG 管线、生产级数据层),列入论文速览的"其他"部分。 生成式推荐侧四篇论文把更多结构化信号——商业价值、地理坐标、协同信号、长尾边界——直接压进 Semantic ID 这一层。腾讯(微信视频号广告)的 UniVA 做到 SID/decoding/serving 三段同时注入 eCPM 信号,离线 Hit Rate@100 +37.04%、线上 A/B GMV +1.5%;UCSD × Snap 的 Latte 从理论上证明自回归 SID 解码树会把语义近的 item 强行拉到一起,再给出在 token 前缀挂 latent 的低成本修补,NDCG@10 +3.45%。 检索侧的故事更激进。一周之内出现三种"重写检索接口"的反命题:Meta Superintelligence Labs 的 SIRA 把多轮 agent 探索压成一次 LLM-corpus 双向扩展的 BM25;Texas A&M / Stanford / UWashington 等 19 作者的 DCI 直接删掉 retriever,让 Claude Sonnet 4.6 用 grep + bash 在原始语料上调查(BrowseComp-Plus accuracy 从 69.0% 升到 80.0%、API 成本降 29.4%);UC Berkeley 的 T3 把 RAG 的"corpus"从文档换成 LLM 思维轨迹,AIME 上给 Gemini-2.5-Flash 注水 +56.3%。MIT 同期放出 OBLIQ-Bench,把"为什么必须改接口"这件事量化——传统 BM25 / dense / late interaction 在隐含意图查询上几乎全部接近 0 NDCG@10。 工业精排和召回侧维持"先拆瓶颈、再谈结构"的节奏。Meta Ads 的 IEFF 把特征下线从 3-6 个月重训压到不需重训,效率类 rollout 提速 5×;阿里淘天的 RecGPT-Mobile 把 next-query LLM 搬到手机端;中科大 × 美团的 DynamicPO 揭示多负样本 DPO 的"偏好优化坍塌"现象并给出梯度抑制的理论解释。整体趋势是:算法侧追求"动态自适应目标",工程侧追求"可回滚的弹性接口"。

AI周报 2026-W19

本周 AI 行业的核心叙事线在三个层面同时收紧。最显眼的是 Anthropic 的 Code with Claude 2026 大会——Claude Managed Agents 同日发布 Outcomes、多 Agent 编排、Dreaming(夜间自我改进)和桌面 Claude Code,配合 SpaceX Colossus $5B/年算力交易和让 Mozilla 单月修复 423 个 Firefox 漏洞的 Claude Mythos 预览,把 Agent 从"一次性脚本"完整推进到"持续运营单元"。 紧贴这条产品线的是研究和工程层面的 Agent Harness Engineering 浪潮。复旦/北大的 AHE 论文、Microsoft 的 Terminus-4B 小模型 subagent、GitHub 自家的 token 审计工作流、Cursor 的 /orchestrate 与 Command Code 的 plumbing 经验,从同一周的不同角度证明:harness 与上下文工程已经成为比模型本身更值得投入的赛道。配合 vLLM × Mooncake 把 KV cache 命中率从 1.7% 拉到 92.2%、Insforge 让 Claude Code 节省 3x token 等具体数字,"先看 harness 还有多少没榨干"正在替代"换更强模型"成为默认动作。 第三条线是基础设施。推理 token 价格一年降 100x,但 hyperscaler 总账单也涨 100x——Jevons paradox 在万亿美元尺度重演。DeepSeek 自报 agentic workload 的 98.7% KV cache 命中率,OpenAI 联合五家硬件厂商发布 MRC 网络协议,Perplexity 自研 ROSE 引擎,NVIDIA 开源 TokenSpeed,再加上 Meta FAIR 的 Compute Optimal Tokenization、Snowflake 的 ZeRO-Prefill、Sakana × NVIDIA 的 TwELL 稀疏格式——整个产业第一次在同一时段集中地把 KV cache、内存层级和网络 fabric 摆到了 GPU FLOPS 之上。

AI 技术日报 - 2026-05-09

今日日报跨越博客、GitHub、论文、KOL推文和播客五大数据源,核心亮点是AI推理效率与Agent安全性的双重突破。BAIR博客系统梳理了自适应并行推理新范式,Anthropic与OpenAI分别从对齐研究和安全运行角度推进Agent落地,而LobeHub等开源项目则让Agent协作触手可及。行业层面,Anthropic估值超越OpenAI、大科技公司AI资本支出超7150亿美元等数据,揭示了AI行业“强者愈强”的马太效应。 精选文章 5 篇 | GitHub 项目 5 个 | 播客 1 集 | KOL 推文 23 条

推荐算法日报 - 2026-05-09

生成式推荐进入工业深水区:今日多篇论文(腾讯UniVA、Snap Latte)聚焦生成式推荐在工业场景的落地挑战。核心矛盾从“如何生成”转向“如何对齐商业价值”和“如何突破表达能力瓶颈”。UniVA提出全链路价值对齐框架,Latte则从理论层面揭示自回归语义ID的结构性限制,标志着该领域从概念验证走向工程优化。; 智能体(Agent)重塑搜索与推荐范式:Meta的SIRA和Waterloo的DCI分别从“单次检索替代多轮探索”和“用grep替代向量检索”两个角度,重新定义了检索接口。ByteDa

AI 技术日报 - 2026-05-08

今日日报跨越博客、GitHub 项目、论文、KOL 推文和播客,核心亮点是 AI Agent 的工程化与成本优化成为绝对主线。从 GitHub 的 token 效率实践、Cursor 的递归 Agent 技能,到开源项目 Goose 和 9Router 的发布,业界正从“能用”转向“好用且省钱”。同时,推理成本下降 100 倍但总账单上升 100 倍的 Jevons 悖论引发广泛讨论,揭示了 Agent 化带来的需求爆发。 精选文章:5 篇 | GitHub 项目:5 个 | KOL 推文:22 条 | 播客精选:2 集

1
...
45678
...
19