推荐算法日报 - 2026-05-19

type

Post

status

Published

date

May 19, 2026 05:00

slug

daily-report-2026-05-19

summary

生成式与Agent范式崛起：今日多篇论文（GenLI、Agent4POI）挑战了传统的检索式或静态嵌入范式。GenLI通过生成式模型直接产生用户兴趣分布，将检索复杂度降至O(1)；Agent4POI则利用LLM Agent在推理时动态生成POI表示，显著提升冷启动和上下文敏感场景效果。这预示着推荐系统正从“匹配”向“生成”演进。; 系统稳定性与异构加速成为工业界焦点：Apple的Fortress论文直面模型随时间不稳定的痛点，提出特征剪枝方案；华为与京东合作的Ascend-RaBitQ则聚焦于N

Section 1: 📊 Trend Analysis

🔥 生成式与Agent范式崛起：今日多篇论文（GenLI、Agent4POI）挑战了传统的检索式或静态嵌入范式。GenLI通过生成式模型直接产生用户兴趣分布，将检索复杂度降至O(1)；Agent4POI则利用LLM Agent在推理时动态生成POI表示，显著提升冷启动和上下文敏感场景效果。这预示着推荐系统正从“匹配”向“生成”演进。

💡 系统稳定性与异构加速成为工业界焦点：Apple的Fortress论文直面模型随时间不稳定的痛点，提出特征剪枝方案；华为与京东合作的Ascend-RaBitQ则聚焦于NPU-CPU异构架构，解决十亿级向量搜索的性能瓶颈。这两篇工业界论文表明，在模型效果之外，系统的鲁棒性和部署效率正成为核心工程挑战。

Section 2: 📋 今日速览

今日速览

美团提出生成式用户兴趣模型GenLI，检索复杂度降至O(1) ↗

同济/蚂蚁提出Agent4POI，动态生成POI表示，冷启动提升2.4倍 ↗

Apple 提出Fortress框架，通过特征剪枝提升模型时间稳定性 ↗

华为/京东提出Ascend-RaBitQ，NPU-CPU异构加速十亿级向量搜索 ↗

Texas A&M 用LLM+RAG结合健康指数做个性化食物推荐 ↗

山大/北理/中大提出GOMA，从图信号平滑视角统一多模态对齐 ↗

Section 3: 📰 Daily Digest

1. Generative Long-term User Interest Modeling for Click-Through Rate Prediction

🔗 原文： https://arxiv.org/abs/2605.15905

🏷️ 来源： 🏭 工业界 | MeiTuan

⭐ 评分： ⭐⭐⭐⭐⭐ (5/5)

🎯 推荐理由： 生成式用户兴趣建模，O(1)检索，线上部署验证。

📝 摘要： 针对传统检索式用户长期兴趣建模存在兴趣不完整、检索耗时长（O(N)）的问题，美团提出GenLI模型。核心创新在于用生成式方法替代检索式：兴趣生成模块（IGM）独立于目标物品，生成多个兴趣分布以覆盖用户多样兴趣；行为检索模块（BRM）通过简单的查找操作将加权复杂度降至O(1)。该方法在美团真实平台部署，服务数亿用户，通过线上A/B实验验证了其在准确性和效率上的显著提升，为工业界处理海量用户行为序列提供了新范式。

2. Agent4POI: Agentic Context-Conditioned Affordance Reasoning for Multimodal Point-of-Interest Recommendation

🔗 原文： https://arxiv.org/abs/2605.15203

🏷️ 来源： 🤝 产学合作 | Tongji University, Ant Group, Fudan University

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 首个推理时动态POI表示框架，理论证明+显著提升。

📝 摘要： 针对传统POI推荐使用静态嵌入无法感知上下文（如同一咖啡馆工作日与周末的不同用途）的问题，本文提出Agent4POI，首个在推理时动态生成上下文条件化多模态表示的框架。论文从理论上证明了静态编码无法满足上下文敏感排序，并设计了一个四阶段LLM Agent：根据情境生成affordance查询，通过五步跨模态推理链分析图像、评论和元数据，最终生成不确定性感知的表示。在三个基准上，该方法相对最强基线提升23.2%，冷启动场景下效果是最好内容基线的2.4倍，为上下文敏感的推荐系统提供了全新思路。

3. Fortress: A Case Study in Stabilizing Search Recommendations via Temporal Data Augmentation and Feature Pruning

🔗 原文： https://arxiv.org/abs/2605.15299

🏷️ 来源： 🏭 工业界 | Apple

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 通过特征剪枝提升推荐模型时间稳定性，离线实验有效。

📝 摘要： 针对搜索推荐模型中某些特征随时间波动导致预测不稳定、影响下游多阶段系统一致性的问题，Apple提出Fortress框架。核心思路是识别并剪除导致分数波动的“不稳定”特征：通过收集历史时间快照，定位预测不稳定的样本，隔离并移除引发不稳定的特征，仅用稳定特征重训模型。该方法在Apple大规模App市场搜索相关性模型上验证，离线实验表明，在保留预测价值的同时有效抑制了行为特征的波动性，显著提升了预测稳定性和分类性能（PR-AUC），对工业级模型鲁棒性优化有直接借鉴意义。

4. Ascend-RaBitQ: Heterogeneous NPU-CPU Acceleration of Billion-Scale Similarity Search with 1-bit Quantization

🔗 原文： https://arxiv.org/abs/2605.16007

🏷️ 来源： 🤝 产学合作 | Huawei, JD.com

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 首个NPU-CPU异构1-bit量化向量搜索系统，性能提升显著。

📝 摘要： 针对十亿级向量搜索中CPU方案存在计算和内存瓶颈，而现有GPU方案无法直接适配NPU架构的问题，华为与京东联合提出Ascend-RaBitQ。核心洞察是将粗排（NPU）和精排（CPU）解耦，发挥各自硬件优势。系统设计了三阶段异构流水线：NPU AI Core加速1-bit量化向量的粗排，AI CPU处理Top-k，CPU主机进行全精度精排。通过融合算子、计算流重构、细粒度负载均衡等四项NPU原生优化，在标准数据集上索引构建速度提升最高62.8倍，吞吐量相比最快CPU基线提升4.6倍，为大规模推荐系统的向量检索提供了高效的国产化硬件解决方案。

5. An LLM-RAG Approach for Healthy Eating Index-Informed Personalized Food Recommendations

🔗 原文： https://arxiv.org/abs/2605.15213

🏷️ 来源： 🎓 学术界 | Texas A&M University

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 用LLM+RAG结合健康饮食指数做个性化食物推荐

📝 摘要： 针对现有食物推荐系统缺乏与权威健康指数（HEI）关联的问题，本文提出一个基于LLM和RAG的个性化食物推荐框架。该方法将检索锚定在NHANES和FPED标准化营养数据库上，构建食物级嵌入空间，计算基线HEI分数，并通过约束RAG管道（基于OpenAI LLM）生成个性化推荐。模拟实验显示，用户平均HEI提升6.45，HEI超过50的用户比例从45.12%提升至61.26%。该工作展示了LLM在特定领域（营养健康）推荐中的应用潜力，但实验为仿真模拟，缺乏线上验证和开源细节，工业落地价值有限。

6. GOMA: Toward Structure-Driven Multimodal Alignment from a Graph Signal Smoothing Perspective

🔗 原文： https://arxiv.org/abs/2605.15723

🏷️ 来源： 🎓 学术界 | Shandong University, Beijing Institute of Technology, Sun Yat-sen University

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 图信号平滑视角统一多模态对齐，结构驱动后对齐框架。

📝 摘要： 针对CLIP等双编码器忽略实体间关系结构的问题，本文提出GOMA，一个从图信号平滑视角出发的结构驱动后对齐框架。它将冻结的多模态嵌入视为图信号，通过解耦消息流向、多模态证据传播和最优平滑深度三个设计选择，学习模态感知的传播算子，进行有限步耦合平滑。在7个多模态属性图（MAG）基准上，GOMA取得了与SOTA相当或更优的检索性能，且稳定性显著优于最强图方法。该方法为利用图结构信息优化预训练多模态嵌入提供了新视角，但属于增量改进，且缺乏大规模系统验证。