推荐算法日报 - 2026-03-25

type

Post

status

Published

date

Mar 25, 2026 05:02

slug

daily-report-2026-03-25

summary

LLM驱动的推荐系统走向深度融合与工程化：今日论文显示，LLM在推荐中的应用已超越简单的文本理解，正与系统核心环节深度融合。从生成式推荐（GEM-Rec）到智能体框架（AgenticRec），再到检索优化（DSL-R1），LLM正被用于统一语义理解、商业逻辑与决策轨迹，标志着技术从“能用”向“好用、易部署”的工程化阶段迈进。; 稀疏与高效成为大规模检索的关键考量：无论是针对代码的SPLADE-Code模型实现亚毫秒级检索，还是ECI指标旨在降低硬负样本评估成本，亦或是TagLLM通过知识蒸馏提升

Section 1: 📊 Trend Analysis

🔥 LLM驱动的推荐系统走向深度融合与工程化：今日论文显示，LLM在推荐中的应用已超越简单的文本理解，正与系统核心环节深度融合。从生成式推荐（GEM-Rec）到智能体框架（AgenticRec），再到检索优化（DSL-R1），LLM正被用于统一语义理解、商业逻辑与决策轨迹，标志着技术从“能用”向“好用、易部署”的工程化阶段迈进。

💡 稀疏与高效成为大规模检索的关键考量：无论是针对代码的SPLADE-Code模型实现亚毫秒级检索，还是ECI指标旨在降低硬负样本评估成本，亦或是TagLLM通过知识蒸馏提升推理效率，都反映出工业界在追求效果的同时，对模型稀疏性、推理延迟和训练成本的高度重视，尤其是在处理亿级参数和百万级文档的场景下。

💡 多模态与细粒度表征持续深化：推荐系统对内容的理解正变得更加精细和全面。TagLLM利用多模态CoT生成细粒度标签，ADaFuSE通过自适应融合提升跨模态检索，LSA则专注于建模用户对商品属性的动态兴趣。这表明，结合视觉、文本等多源信息，进行更细粒度的用户与内容表征，是提升推荐精准度和可解释性的重要方向。

Section 2: 📋 今日速览

今日速览

NAVER LABS Europe 提出SPLADE-Code模型家族，代码检索SOTA且亚毫秒延迟 ↗

得物Dewu 用LLM生成细粒度标签，冷启动PVCTR提升32.37% ↗

Google 提出GEM-Rec框架，将竞价机制融入生成式推荐 ↗

厦门大学提出AgenticRec框架，统一推理、工具使用与排序优化 ↗

Google 提出DSL-R1框架，融合符号与语义检索，Hit@1/3提升12.3% ↗

学术界提出ECI指标，理论化评估硬负样本质量，减少重复微调 ↗

学术界提出融合协同过滤与模糊聚合的群组推荐框架 ↗

学术界提出MI-DPG网络，基于互信息正则化优化多场景CVR预测 ↗

北京工业大学提出LSA Transformer建模动态属性兴趣，平均MSE提升2.55% ↗

湖南大学提出ADaFuSE方法自适应融合扩散图像与文本，Hits@10提升3.49% ↗

Section 3: 📰 Daily Digest

1. On the Challenges and Opportunities of Learned Sparse Retrieval for Code

🔗 原文： https://arxiv.org/abs/2603.22008

🏷️ 来源： 🏭 工业界 | NAVER LABS Europe

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 首个针对代码检索的大规模学习稀疏检索模型家族，在MTEB Code基准上SOTA且实现亚毫秒延迟。

📝 摘要： 本文针对LLM驱动的软件工程系统中代码检索的挑战，首次系统化地将学习稀疏检索（LSR）应用于该领域。提出的SPLADE-Code模型家族（600M-8B参数）通过轻量级单阶段训练，在MTEB Code基准上达到SOTA性能（8B模型达79.0分）。其核心创新在于利用学习到的扩展词元来弥合词汇与语义匹配的鸿沟，并通过对百万级文档集合的延迟分析，证明了LSR能在几乎不损失效果的前提下实现亚毫秒级检索，为工业级代码检索系统提供了高效解决方案。

2. TagLLM: A Fine-Grained Tag Generation Approach for Note Recommendation

🔗 原文： https://arxiv.org/abs/2603.21481

🏷️ 来源： 🤝 产学合作 | Dewu, Tongji University, Tsinghua

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 得物提出TagLLM，用LLM生成细粒度标签提升笔记推荐，线上A/B实验冷启动PVCTR提升32.37%。

📝 摘要： 本文针对电商社区笔记推荐中标签生成粗粒度和冗余的问题，提出了TagLLM方法。该方法通过“用户兴趣手册”捕捉跨品类兴趣，并利用多模态思维链（CoT）提取构建细粒度标签数据。为了提升推理效率，还开发了标签知识蒸馏技术，将大模型能力迁移至小模型。在线A/B测试表明，TagLLM显著提升了用户体验和互动，尤其在冷启动场景下，页面浏览点击率（PVCTR）提升了32.37%，为利用LLM生成可解释标签以增强推荐效果提供了有效的工业实践。

3. One Model, Two Markets: Bid-Aware Generative Recommendation

🔗 原文： https://arxiv.org/abs/2603.22231

🏷️ 来源： 🏭 工业界 | Google

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： Google提出GEM-Rec，首次将竞价机制融入生成式推荐，实现商业收益与语义相关性的统一优化。

📝 摘要： 本文针对现有生成式推荐系统（如TIGER）缺乏商业变现能力的问题，提出了GEM-Rec统一框架。该框架创新性地引入控制令牌来解耦“是否展示广告”与“展示哪个物品”的决策，使模型能从交互日志中直接学习有效的广告投放模式。同时，设计了竞价感知解码机制，在推理过程中直接注入竞价信息，引导模型生成高价值物品，并理论证明了该机制能保证分配单调性（高竞价弱增加展示概率）。GEM-Rec首次在生成式推荐中实现了语义相关性与平台收入的动态联合优化。

4. AgenticRec: End-to-End Tool-Integrated Policy Optimization for Ranking-Oriented Recommender Agents

🔗 原文： https://arxiv.org/abs/2603.21613

🏷️ 来源： 🎓 学术界 | Xiamen University

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 提出首个端到端工具集成策略优化框架，统一推理、工具使用和排序优化，显著提升LLM推荐性能。

📝 摘要： 本文针对现有推荐智能体在中间推理与最终排序反馈脱节的问题，提出了AgenticRec框架。该框架将推荐专用工具集成到ReAct循环中，支持基于证据的推理。其核心贡献包括：提出了理论上无偏的列表级组相对策略优化算法，以在稀疏反馈下优化包含推理、工具调用和排序生成的整个决策轨迹；并引入了渐进式偏好细化方法，通过挖掘困难负样本和双向对齐来解决细粒度偏好歧义。实验证明该框架显著优于基线，验证了统一推理、工具使用和排序优化的必要性。

5. DSL-R1: From SQL to DSL for Training Retrieval Agents across Structured and Unstructured Data with Reinforcement Learning

🔗 原文： https://arxiv.org/abs/2603.21018

🏷️ 来源： 🏭 工业界 | Google

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 工业界论文提出DSL-R1框架，融合符号推理与语义匹配，在邮件检索中提升12.3%

📝 摘要： 本文为解决复杂领域中结构化元数据与非结构化内容检索割裂的问题，提出了DSL-R1框架。该框架通过一种新颖的领域特定语言，将向量原语嵌入到SQL风格的操作符中，从而协同符号推理的精确性与语义匹配的覆盖度。进一步引入强化学习机制，利用基于规则的执行反馈和检索质量奖励来联合优化DSL生成，平衡结构正确性与语义对齐。在大规模工业邮件基准测试上的评估显示，DSL-R1在Hit@1/3指标上实现了12.3%的提升，为混合检索建立了稳健的新范式。

6. ECI: Effective Contrastive Information to Evaluate Hard-Negatives

🔗 原文： https://arxiv.org/abs/2603.20990

🏷️ 来源： 🎓 学术界 | Aarush Sinha, Rahul Seetharaman, Aman Bansal

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出ECI指标，理论化评估硬负样本质量，减少重复微调成本。

📝 摘要： 本文针对评估硬负样本质量需要重复微调、计算成本高的问题，提出了基于信息论和检索原则的理论化指标ECI。ECI通过优化信息容量与判别效率之间的权衡来评估负样本，其中判别效率是信号强度与安全性的调和平衡。与启发式方法不同，ECI严格惩罚生成式方法中常见的虚假正例负样本。实验表明，ECI能够准确预测下游检索性能，识别出混合策略在数量与可靠性上的最优平衡，从而显著减少昂贵的端到端消融实验需求。

7. Consensus-Driven Group Recommendation on Sparse Explicit Feedback: A Collaborative Filtering and Choquet-Borda Aggregation Framework

🔗 原文： https://arxiv.org/abs/2603.21012

🏷️ 来源： 🎓 学术界 | arXiv

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出融合协同过滤与模糊聚合的群组推荐框架，提升稀疏数据下的共识与公平性。

📝 摘要： 本文针对仅有稀疏用户-物品-评分数据、缺乏其他信息的群组推荐场景，提出了一个共识驱动的混合框架。该框架结合了基于邻域的协同过滤与模糊聚合方法，通过一种综合相似度度量来稳定地估计缺失评分并构建面向共识的邻居关系。利用Borda Count机制生成候选物品以缓解评分偏差，并最终使用Choquet积分计算群组评分，灵活捕捉异质性用户影响力同时保证公平性。在真实数据集上的实验表明，该方法能有效提升群组层面的共识、满意度和公平性。

8. MI-DPG: Decomposable Parameter Generation Network Based on Mutual Information for Multi-Scenario Recommendation

🔗 原文： https://arxiv.org/abs/2603.21209

🏷️ 来源： 🎓 学术界 | 未知

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出基于互信息正则化的可分解参数生成网络，提升多场景CVR预测效果。

📝 摘要： 本文针对多场景CVR预测中难以低成本提升各场景性能的挑战，提出了MI-DPG模型。该方法通过一个辅助网络生成场景条件化的动态权重矩阵，该矩阵由分解后的场景特定和场景共享低秩矩阵高效组合而成，用于调制主干模型的完整参数空间，从而针对不同场景专业化模型参数。此外，设计了互信息正则化项，通过最大化场景感知输入与动态权重矩阵之间的互信息，来增强不同场景间模型参数的多样性。在三个真实数据集上的实验表明，MI-DPG显著优于先前的多场景推荐模型。

9. LSA: A Long-Short-term Aspect Interest Transformer for Aspect-Based Recommendation

🔗 原文： https://arxiv.org/abs/2603.21243

🏷️ 来源： 🎓 学术界 | Beijing University of Technology, Beijing Institute of Graphic Communication

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出LSA Transformer，结合长短期兴趣建模动态用户偏好，在四个数据集上平均MSE提升2.55%。

📝 摘要： 本文针对现有基于属性的推荐方法忽略用户兴趣动态变化的问题，提出了长短时属性兴趣Transformer模型。LSA通过整合长短期兴趣来有效捕捉用户偏好的动态性：短期兴趣建模近期交互属性的重要性变化，长期兴趣则考虑包括用户近期未交互属性在内的全局行为模式。最终，LSA结合长短时兴趣来评估用户与物品属性邻域并集中各属性的重要性，从而为每次用户-物品交互准确分配属性权重。在四个真实数据集上的实验证明，LSA平均将MSE提升了2.55%。

10. ADaFuSE: Adaptive Diffusion-generated Image and Text Fusion for Interactive Text-to-Image Retrieval

🔗 原文： https://arxiv.org/abs/2603.21886

🏷️ 来源： 🎓 学术界 | Hunan University, University of Glasgow

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出自适应扩散-文本融合方法ADaFuSE，提升交互式跨模态检索性能，参数增加仅5.29%。

📝 摘要： 本文针对交互式文本到图像检索中，简单嵌入加法会 indiscriminately 融合扩散模型产生的生成噪声导致性能下降的问题，提出了轻量级融合模型ADaFuSE。该方法采用双分支机制：自适应门控分支动态平衡多模态视图的可靠性；语义感知混合专家分支捕捉细粒度跨模态细节。ADaFuSE无需修改主干编码器即可插入现有框架。在四个标准基准上的评估表明，ADaFuSE以仅5.29%的参数增长实现了SOTA性能，在Hits@10上最高超越DAR 3.49%，并对噪声和长查询表现出更强的鲁棒性。