推荐算法只可锦上添花,不能雪中送炭

在和很多产品、运营团队合作的过程中,我常不得不扮演那个“泼冷水”的角色,特别是当大家对推荐算法寄予厚望的时候。 听到这样的战略规划:“我们明年目标是增长 80%,推荐系统是其中的关键。” 我的观点很直接:如果你的增长战略严重依赖推荐算法,一旦算法效果不及预期,目标就直接崩盘,那么这本质上是一个糟糕的战略**。对于规模增长,推荐算法不能雪中送炭,它只能在规模之上锦上添花。

从RL比SFT更不容易遗忘到反观推荐系统缺陷

最近陆续有了一些研究LLM中RL相比SFT更不容易造成灾难性遗忘的工作,清晰地支出是RL的On-Policy特性带来了参数的稳定,而SFT将模型参数推向与预训练分布差异很大的方向,导致了遗忘问题(如图,遗忘问题的衡量就是随着新任务的学习,旧任务的平均表现下降)。 这一清晰地结论,点亮了我对很多事情的理解,推荐系统原来孤立的问题也有可能连成一片,有了更深层次的支撑。 本文包括: • LLM领域,RL比SFT更不容易造成灾难性遗忘的工作解读 • 推荐系统是标准的off-policy 监督学习,(猜想)许多缺陷也应当由此而生

AI 技术日报 - 2026-03-30

今日内容跨越博客文章、GitHub热门项目和X平台推文,核心焦点集中在AI Agent生态的快速演进与工具链整合。从OpenClaw转型为MCP服务器,到各类开源运行时、记忆系统和学习框架的涌现,Agent开发正从概念验证走向工程化实践。同时,关于AI的社会影响(如教育、心理健康)和行业动态(如企业采纳、内部工具)的讨论也备受关注。 精选文章: 5篇(均为3分) GitHub热门项目: 5个(均为4分) X推文动态: 24条(精选归类)

AI 技术日报 - 2026-03-29

今日内容跨越技术博客、X推文和GitHub项目,核心趋势是AI Agent生态的竞争与工具化进程全面加速。各大厂商竞相推出“应用商店”或标准协议,而开源社区则涌现出大量提升Agent能力、安全性和生产力的工具与框架。开发者正从理论探索转向构建可投入生产的复杂Agent系统。 精选文章:5篇(均为3分) GitHub热门项目:3个(5分1个,4分2个) X推文动态:24条

AI 技术日报 - 2026-03-28

今日内容跨越了博客文章、GitHub热门项目、AI播客以及X平台上的KOL动态,核心亮点聚焦于AI Agent技术的全面落地与生态爆发。从企业级应用、开源框架到个人开发实践,Agent正从概念走向生产,同时,围绕Agent的记忆、协作与工具生态成为创新热点。此外,AI厂商在数据可移植性上的竞争以及AI对传统行业的重塑也值得关注。 精选文章:5篇(4分文章2篇,3分文章3篇) GitHub热门项目:5个(5分项目4个,4分项目1个) AI播客精选:1集(5分) X推文动态:24条

AI 技术日报 - 2026-03-27

今日内容跨越博客文章、GitHub项目、播客及X平台动态,核心趋势聚焦于AI智能体(Agent)基础设施的快速演进与多模态交互能力的深化。从Stripe等公司推出CLI工具简化Agent配置,到微软发布视觉交互规划基准,再到Google推出实时多模态语音模型,均指向Agent正从概念走向实用,其工具链和感知能力成为竞争焦点。今日精选文章5篇、GitHub项目5个、播客1集、X推文24条。

AI 技术日报 - 2026-03-26

今日内容跨越了博客文章、GitHub项目、AI播客及X平台推文,核心趋势聚焦于智能体(Agent)能力的深度扩展与风险反思,以及基础设施与边缘计算的演进。一方面,智能体正从简单的代码生成向自动化办公、跨链操作、科学发现等复杂任务迈进,但同时也引发了关于开发速度与代码质量的“认知债务”担忧。另一方面,从英伟达的万亿收入预期到边缘AI的落地挑战,算力与部署的讨论持续深入。 精选文章:5篇(1篇4分,4篇3分) GitHub热门项目:4个(均为4分) X推文动态:24条 播客精选:2集(均为4分)

AI 技术日报 - 2026-03-25

今日内容跨越博客文章、GitHub项目、播客及X推文,核心亮点聚焦于AI Agent生态的安全风险与生产级工具链的成熟。一方面,LiteLLM供应链攻击事件揭示了AI基础设施的脆弱性;另一方面,多个高星GitHub项目展示了多Agent编排、安全测试、记忆管理等领域的专业化、生产就绪解决方案。同时,Claude Code等工具的功能更新和跨平台集成,标志着AI辅助开发正从实验走向深度工作流融合。 精选文章:5篇(4分文章2篇,3分文章3篇) GitHub项目:5个(5分项目4个,4分项目1个) 播客单集:1集(4分) X推文:24条

AI 技术日报 - 2026-03-24

今日内容跨越博客文章、GitHub项目、AI播客及X平台推文,核心围绕AI Agent的实践、评估与生态构建展开。从Meta收购Dreamer团队到OpenAI宣布构建自主AI研究员,再到多个开源Agent框架的涌现,智能体技术正从概念验证加速迈向规模化应用与深度集成。同时,多模态模型(如Luma的Uni-1)的竞争与AI基础设施(如NVIDIA的扩展定律)的讨论也持续升温。 精选文章:5篇(4分1篇,3分4篇) GitHub热门项目:5个(5分1个,4分4个) AI播客精选:1集(5分) X推文动态:24条(整理为18条摘要)

AI 技术日报 - 2026-03-23

今日内容跨越博客文章、X推文和GitHub热门项目,核心趋势聚焦于AI Agent技术的深度实践与生态扩张。从企业级平台合作到开源技能库,从沙箱化安全实践到多智能体协作框架,AI从业者正从理论探讨转向复杂系统的工程化落地。今日精选文章5篇、GitHub项目5个、X推文动态24条。

AI 技术日报 - 2026-03-22

今日内容跨越博客文章、GitHub热门项目及X平台推文,核心聚焦于AI智能体(Agent)的“具身化”与工程化落地。从超越人类性能的计算机使用智能体,到将Git、文档处理等传统工具无缝集成进AI工作流的实践,再到各大公司围绕自主智能体展开的长期战略布局,技术趋势正从模型能力竞赛转向构建可执行、可协作的完整系统。今日精选文章5篇、GitHub项目4个、X推文24条。

推荐周报 2026-W12

本周推荐系统研究围绕三条技术主线展开。第一条是 Semantic ID 驱动的生成式检索持续升温——Spotify 同时放出两篇论文,一篇将 SID 系统部署上线并跑通 A/B test(新节目发现率 +14.3%),另一篇将 SID 作为独立模态统一搜索、推荐和推理,工业界 SID 系统正从"能不能用"进入"怎么用得更好"的阶段。第二条是多模态检索与表示压缩:Apple 交出统一文本/图像/视频的生产级检索架构,Aalto University 将 2B 参数的 VLM 蒸馏为 69M 的文本编码器(延迟降低 50 倍),POSTECH 发现并修复了 VLM embedder 做推荐时的模态崩溃问题。 第三条是工业级精排的信息流控制。阿里巴巴和 Meta 的三篇论文从不同角度切入同一命题——不再无差别地喂入所有特征和信号,而是控制特征参与交互的时机(延迟掩码)、筛选值得精细交互的行为(核心行为选择)、标准化行为信号的分布语义(条件去偏)。Meta 的 MBD 框架尤其值得关注,已部署在两个十亿级用户的短视频平台上,将观看时长与视频时长的相关性从 0.514 压到 0.003。