type
Post
status
Published
date
May 19, 2026 05:00
slug
daily-report-2026-05-19
summary
生成式与Agent范式崛起:今日多篇论文(GenLI、Agent4POI)挑战了传统的检索式或静态嵌入范式。GenLI通过生成式模型直接产生用户兴趣分布,将检索复杂度降至O(1);Agent4POI则利用LLM Agent在推理时动态生成POI表示,显著提升冷启动和上下文敏感场景效果。这预示着推荐系统正从“匹配”向“生成”演进。; 系统稳定性与异构加速成为工业界焦点:Apple的Fortress论文直面模型随时间不稳定的痛点,提出特征剪枝方案;华为与京东合作的Ascend-RaBitQ则聚焦于N
tags
推荐系统
日报
category
推荐技术报告
icon
📚
password
priority
1
# 推荐算法日报 2026-05-19
Section 1: 📊 Trend Analysis
- 🔥 生成式与Agent范式崛起:今日多篇论文(GenLI、Agent4POI)挑战了传统的检索式或静态嵌入范式。GenLI通过生成式模型直接产生用户兴趣分布,将检索复杂度降至O(1);Agent4POI则利用LLM Agent在推理时动态生成POI表示,显著提升冷启动和上下文敏感场景效果。这预示着推荐系统正从“匹配”向“生成”演进。
- 💡 系统稳定性与异构加速成为工业界焦点:Apple的Fortress论文直面模型随时间不稳定的痛点,提出特征剪枝方案;华为与京东合作的Ascend-RaBitQ则聚焦于NPU-CPU异构架构,解决十亿级向量搜索的性能瓶颈。这两篇工业界论文表明,在模型效果之外,系统的鲁棒性和部署效率正成为核心工程挑战。
Section 2: 📋 今日速览
今日速览 |
美团 提出生成式用户兴趣模型GenLI,检索复杂度降至O(1) ↗ |
同济/蚂蚁 提出Agent4POI,动态生成POI表示,冷启动提升2.4倍 ↗ |
Apple 提出Fortress框架,通过特征剪枝提升模型时间稳定性 ↗ |
华为/京东 提出Ascend-RaBitQ,NPU-CPU异构加速十亿级向量搜索 ↗ |
Texas A&M 用LLM+RAG结合健康指数做个性化食物推荐 ↗ |
山大/北理/中大 提出GOMA,从图信号平滑视角统一多模态对齐 ↗ |
Section 3: 📰 Daily Digest
1. Generative Long-term User Interest Modeling for Click-Through Rate Prediction
🔗 原文: https://arxiv.org/abs/2605.15905
🏷️ 来源: 🏭 工业界 | MeiTuan
⭐ 评分: ⭐⭐⭐⭐⭐ (5/5)
🎯 推荐理由: 生成式用户兴趣建模,O(1)检索,线上部署验证。
📝 摘要: 针对传统检索式用户长期兴趣建模存在兴趣不完整、检索耗时长(O(N))的问题,美团提出GenLI模型。核心创新在于用生成式方法替代检索式:兴趣生成模块(IGM)独立于目标物品,生成多个兴趣分布以覆盖用户多样兴趣;行为检索模块(BRM)通过简单的查找操作将加权复杂度降至O(1)。该方法在美团真实平台部署,服务数亿用户,通过线上A/B实验验证了其在准确性和效率上的显著提升,为工业界处理海量用户行为序列提供了新范式。
2. Agent4POI: Agentic Context-Conditioned Affordance Reasoning for Multimodal Point-of-Interest Recommendation
🔗 原文: https://arxiv.org/abs/2605.15203
🏷️ 来源: 🤝 产学合作 | Tongji University, Ant Group, Fudan University
⭐ 评分: ⭐⭐⭐⭐ (4/5)
🎯 推荐理由: 首个推理时动态POI表示框架,理论证明+显著提升。
📝 摘要: 针对传统POI推荐使用静态嵌入无法感知上下文(如同一咖啡馆工作日与周末的不同用途)的问题,本文提出Agent4POI,首个在推理时动态生成上下文条件化多模态表示的框架。论文从理论上证明了静态编码无法满足上下文敏感排序,并设计了一个四阶段LLM Agent:根据情境生成affordance查询,通过五步跨模态推理链分析图像、评论和元数据,最终生成不确定性感知的表示。在三个基准上,该方法相对最强基线提升23.2%,冷启动场景下效果是最好内容基线的2.4倍,为上下文敏感的推荐系统提供了全新思路。
3. Fortress: A Case Study in Stabilizing Search Recommendations via Temporal Data Augmentation and Feature Pruning
🔗 原文: https://arxiv.org/abs/2605.15299
🏷️ 来源: 🏭 工业界 | Apple
⭐ 评分: ⭐⭐⭐⭐ (4/5)
🎯 推荐理由: 通过特征剪枝提升推荐模型时间稳定性,离线实验有效。
📝 摘要: 针对搜索推荐模型中某些特征随时间波动导致预测不稳定、影响下游多阶段系统一致性的问题,Apple提出Fortress框架。核心思路是识别并剪除导致分数波动的“不稳定”特征:通过收集历史时间快照,定位预测不稳定的样本,隔离并移除引发不稳定的特征,仅用稳定特征重训模型。该方法在Apple大规模App市场搜索相关性模型上验证,离线实验表明,在保留预测价值的同时有效抑制了行为特征的波动性,显著提升了预测稳定性和分类性能(PR-AUC),对工业级模型鲁棒性优化有直接借鉴意义。
4. Ascend-RaBitQ: Heterogeneous NPU-CPU Acceleration of Billion-Scale Similarity Search with 1-bit Quantization
🔗 原文: https://arxiv.org/abs/2605.16007
🏷️ 来源: 🤝 产学合作 | Huawei, JD.com
⭐ 评分: ⭐⭐⭐⭐ (4/5)
🎯 推荐理由: 首个NPU-CPU异构1-bit量化向量搜索系统,性能提升显著。
📝 摘要: 针对十亿级向量搜索中CPU方案存在计算和内存瓶颈,而现有GPU方案无法直接适配NPU架构的问题,华为与京东联合提出Ascend-RaBitQ。核心洞察是将粗排(NPU)和精排(CPU)解耦,发挥各自硬件优势。系统设计了三阶段异构流水线:NPU AI Core加速1-bit量化向量的粗排,AI CPU处理Top-k,CPU主机进行全精度精排。通过融合算子、计算流重构、细粒度负载均衡等四项NPU原生优化,在标准数据集上索引构建速度提升最高62.8倍,吞吐量相比最快CPU基线提升4.6倍,为大规模推荐系统的向量检索提供了高效的国产化硬件解决方案。
5. An LLM-RAG Approach for Healthy Eating Index-Informed Personalized Food Recommendations
🔗 原文: https://arxiv.org/abs/2605.15213
🏷️ 来源: 🎓 学术界 | Texas A&M University
⭐ 评分: ⭐⭐⭐ (3/5)
🎯 推荐理由: 用LLM+RAG结合健康饮食指数做个性化食物推荐
📝 摘要: 针对现有食物推荐系统缺乏与权威健康指数(HEI)关联的问题,本文提出一个基于LLM和RAG的个性化食物推荐框架。该方法将检索锚定在NHANES和FPED标准化营养数据库上,构建食物级嵌入空间,计算基线HEI分数,并通过约束RAG管道(基于OpenAI LLM)生成个性化推荐。模拟实验显示,用户平均HEI提升6.45,HEI超过50的用户比例从45.12%提升至61.26%。该工作展示了LLM在特定领域(营养健康)推荐中的应用潜力,但实验为仿真模拟,缺乏线上验证和开源细节,工业落地价值有限。
6. GOMA: Toward Structure-Driven Multimodal Alignment from a Graph Signal Smoothing Perspective
🔗 原文: https://arxiv.org/abs/2605.15723
🏷️ 来源: 🎓 学术界 | Shandong University, Beijing Institute of Technology, Sun Yat-sen University
⭐ 评分: ⭐⭐⭐ (3/5)
🎯 推荐理由: 图信号平滑视角统一多模态对齐,结构驱动后对齐框架。
📝 摘要: 针对CLIP等双编码器忽略实体间关系结构的问题,本文提出GOMA,一个从图信号平滑视角出发的结构驱动后对齐框架。它将冻结的多模态嵌入视为图信号,通过解耦消息流向、多模态证据传播和最优平滑深度三个设计选择,学习模态感知的传播算子,进行有限步耦合平滑。在7个多模态属性图(MAG)基准上,GOMA取得了与SOTA相当或更优的检索性能,且稳定性显著优于最强图方法。该方法为利用图结构信息优化预训练多模态嵌入提供了新视角,但属于增量改进,且缺乏大规模系统验证。