推荐算法日报 - 2026-03-19

type

Post

status

Published

date

Mar 19, 2026 14:39

slug

daily-report-2026-03-19

summary

LLM驱动的推荐画像构建：今日多篇论文聚焦于利用大语言模型（LLM）从文本信息（如评论）中提取结构化、多因子的用户/物品画像，以增强推荐的语义理解和个性化能力，标志着LLM正从通用内容生成向精细化特征工程演进。; 在线学习与自适应系统：针对非平稳环境和动态用户偏好，研究重点转向在线学习和自适应算法。从Bandit算法（如C3 Thompson Sampling）到LLM的在线提示路由（CCLUB），核心目标是在无需重训练的情况下，实现模型的实时调整与性能优化。; 🔬 图表示学习的鲁棒性增强：为

Section 1: 📊 Trend Analysis

🔥 LLM驱动的推荐画像构建：今日多篇论文聚焦于利用大语言模型（LLM）从文本信息（如评论）中提取结构化、多因子的用户/物品画像，以增强推荐的语义理解和个性化能力，标志着LLM正从通用内容生成向精细化特征工程演进。

💡 在线学习与自适应系统：针对非平稳环境和动态用户偏好，研究重点转向在线学习和自适应算法。从Bandit算法（如C3 Thompson Sampling）到LLM的在线提示路由（CCLUB），核心目标是在无需重训练的情况下，实现模型的实时调整与性能优化。

🔬 图表示学习的鲁棒性增强：为应对推荐系统中普遍存在的数据稀疏和噪声问题，图神经网络（GNN）的研究正结合更先进的表示学习技术，如扩散模型和非对称对比学习（RaDAR），旨在生成更鲁棒、更具泛化能力的用户与物品嵌入。

Section 2: 📋 今日速览

今日速览

中科院&京东提出基于纤维束的几何推荐范式，理论创新性强 ↗

USC&世宗大学用LLM从评论生成多因子画像，提升餐厅推荐个性化 ↗

港中文&华盛顿大学提出CCLUB框架，在线路由提示实现LLM自适应对齐 ↗

滑铁卢大学等提出C3 Thompson采样算法，在MIND数据集上点击提升12.4% ↗

电子科大&蚂蚁集团结合扩散模型与图对比学习，提升稀疏噪声下推荐性能 ↗

Section 3: 📰 Daily Digest

1. RecBundle: A Next-Generation Geometric Paradigm for Explainable Recommender Systems

🔗 原文： https://arxiv.org/abs/2603.16088

🏷️ 来源： 🤝 产学合作 | Chinese Academy of Sciences, JD.com

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出基于纤维束理论的几何分析范式，为推荐系统解耦异构信息提供新视角。

📝 摘要： 本文旨在解决推荐系统中因异构信息（如用户社交网络与历史交互）耦合在同一向量空间而导致的系统性偏差（如信息茧房）难以溯源的问题。为此，论文引入微分几何中的纤维束理论，提出RecBundle框架，将系统空间解耦为基础流形（用户交互网络）和纤维层（用户动态偏好），从而形式化用户协作与内容演化。该理论框架新颖，在MovieLens和Amazon Beauty数据集上进行了验证，并展望了量化信息茧房、集成LLM等未来方向，但缺乏大规模线上验证，属于前沿理论探索。

2. ReFORM: Review-aggregated Profile Generation via LLM with Multi-Factor Attention for Restaurant Recommendation

🔗 原文： https://arxiv.org/abs/2603.16236

🏷️ 来源： 🎓 学术界 | University of Southern California, Sejong University

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 利用LLM从评论生成多因子画像，结合注意力机制提升餐厅推荐个性化效果。

📝 摘要： 针对现有LLM增强推荐方法主要依赖物品标题而忽略用户决策多因子（如口味、氛围）的问题，本文提出ReFORM框架。该框架首先利用LLM从用户评论中生成因子特定的用户和物品画像，以捕捉细粒度偏好；然后设计多因子注意力机制，在排序阶段动态突出对当前用户决策影响最大的因子。在两个不同规模的餐厅推荐数据集上的实验表明，该方法优于现有基线，并通过模块分析验证了其个性化效果，但尚未在工业级场景进行大规模在线验证。

3. Steering Frozen LLMs: Adaptive Social Alignment via Online Prompt Routing

🔗 原文： https://arxiv.org/abs/2603.15647

🏷️ 来源： 🎓 学术界 | CUHK, UW

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出CCLUB框架，通过在线提示路由实现LLM自适应社会对齐，提升安全性和效用平衡。

📝 摘要： 为解决静态对齐的LLM无法适应动态演变的越狱攻击和多元化安全规范的问题，本文提出了共识聚类LinUCB Bandit（CCLUB）框架，实现无需重训练的推理时治理。该框架通过在线Bandit算法（LinUCB）路由选择不同的系统提示来引导冻结的LLM，并引入保守的共识聚类机制，防止在语义相近但风险分化的上下文间进行不安全泛化。理论分析证明了其次线性遗憾界，实验显示其累积奖励提升10.98%，平均次优差距减少14.42%。该方法虽非直接针对推荐，但其在线自适应决策思想对推荐系统的探索利用和安全内容过滤有借鉴价值。

4. A Practical Algorithm for Feature-Rich, Non-Stationary Bandit Problems

🔗 原文： https://arxiv.org/abs/2603.16755

🏷️ 来源： 🎓 学术界 | University of Waterloo, Vector Institute, Manulife Financial

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出C3 Thompson sampling算法，解决特征丰富、非平稳bandit问题，在MIND数据集上实现12.4%点击提升。

📝 摘要： 本文针对一个更现实的Bandit问题场景，即同时包含稠密臂特征、非线性奖励函数以及奖励分布随时间变化但相关性保持的挑战，提出了条件耦合上下文C3 Thompson采样算法。该算法结合了嵌入空间上的改进Nadaraya-Watson估计器（一种基于注意力的核回归方法）与Thompson采样，支持无需重训练的在线学习。在多个公开表格数据集和微软新闻数据集（MIND）上的实验表明，C3算法实现了更低的累计遗憾，并在MIND上取得了12.4%的点击提升，为推荐系统中的在线排序和探索利用问题提供了有效的解决方案。

5. RaDAR: Relation-aware Diffusion-Asymmetric Graph Contrastive Learning for Recommendation

🔗 原文： https://arxiv.org/abs/2603.16800

🏷️ 来源： 🤝 产学合作 | University of Electronic Science and Technology of China, Ant Group, Tsinghua University

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出RaDAR框架，结合扩散模型和图对比学习，提升推荐在稀疏和噪声条件下的性能。

📝 摘要： 为解决图对比学习（GCL）中随机边扰动破坏关键结构、以及数据稀疏限制协同信号传播的问题，本文提出RaDAR框架。该框架创新性地结合了两种视图生成机制：一个图生成模型捕获全局结构，一个关系感知去噪模型细化噪声边。其核心包括非对称对比学习与全局负采样以保持语义对齐，扩散引导的增强以提升鲁棒性，以及基于节点语义动态调整边权的关系感知边缘细化。在三个公开基准测试上的广泛实验表明，RaDAR consistently优于现有SOTA方法，尤其在噪声和稀疏条件下表现突出，为提升基于GNN的召回模型鲁棒性提供了新思路。