推荐算法日报 - 2026-02-26

type

status

date

slug

summary

Section 1: 📊 Trend Analysis

🔥 生成式推荐的结构化注入：生成式推荐（Generative-Rec）正从简单的序列生成向融入结构化先验知识演进。今日论文通过将物品分层token化形成的Trie结构显式编码到Transformer中，显著提升了模型性能，表明在生成范式下，有效利用物品间的固有拓扑关系是提升效果的关键方向。

💡 LLM从在线推理转向离线知识固化：为平衡LLM强大语义理解能力与线上推理的高延迟矛盾，一种新范式正在兴起：将LLM昂贵的在线推理转移到离线阶段，用于生成结构化、可解释的“知识”（如物品人格表示），在线仅需轻量级匹配。这为LLM在重排等场景的工业落地提供了可行路径。

🔧 系统级效率优化成为焦点：无论是联邦学习中的通信协议革新（用聚类标签替代高维嵌入），还是向量检索库的底层算法优化（HNSW的量化与重排），都显示出推荐系统在追求效果的同时，对全链路效率（通信、内存、计算）的极致优化已成为核心议题，直接影响大规模部署的可行性。

Section 2: 📋 今日速览

今日速览

浙大&蚂蚁提出Trie结构感知的生成式推荐，性能平均提升8.83% ↗

VIVO 推出LLM智能体自动化LTV建模框架，已成功在线部署 ↗

北航等用聚类标签替代嵌入传输优化联邦推荐，通信开销显著降低 ↗

延世大学&NAVER 用LLM离线构建物品人格索引，重排延迟降低99.6% ↗

亚利桑那州立大学优化HNSW向量检索，QPS提升2.5-3.3倍，内存减少75% ↗

Section 3: 📰 Daily Digest

1. Trie-Aware Transformers for Generative Recommendation

🔗 原文： https://arxiv.org/abs/2602.21677v1

🏷️ 来源： 🤝 产学合作 | Zhejiang University, Ant Group

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 为生成式推荐引入Trie结构感知的位置编码，显著提升性能，方法新颖且实验扎实。

📝 摘要： 本文针对生成式推荐中将物品映射为分层token序列时，标准Transformer忽视底层Trie（前缀树）结构的问题，提出了TrieRec方法。其核心创新在于为Transformer设计了两种位置编码：Trie感知的绝对位置编码（聚合节点深度、祖先等结构信息）和拓扑感知的相对位置编码（在自注意力中注入成对结构关系），从而将物品的层次化拓扑结构显式地注入模型。该方法模型无关、高效且无需额外超参，在三个代表性生成式推荐骨干模型和四个真实数据集上实现了平均8.83%的性能提升，并通过充分的消融实验验证了其有效性，对推进生成式推荐范式具有重要启发和落地价值。

2. AgentLTV: An Agent-Based Unified Search-and-Evolution Framework for Automated Lifetime Value Prediction

🔗 原文： https://arxiv.org/abs/2602.21634v1

🏷️ 来源： 🏭 工业界 | VIVO

⭐ 评分： ⭐⭐⭐⭐ (4/5)

🎯 推荐理由： 工业界落地的自动化LTV建模框架，结合LLM智能体与搜索进化算法，有效降低建模成本并提升预测性能。

📝 摘要： 本文提出AgentLTV，一个基于LLM智能体的自动化LTV建模框架，旨在解决广告和推荐系统中因业务场景多样导致的LTV模型构建成本高、迁移难的问题。该框架将每个候选解决方案视为可执行的流水线程序，由LLM驱动的智能体负责代码生成、运行修复和反馈分析。它采用两阶段搜索策略：蒙特卡洛树搜索（MCTS）阶段在固定预算下广泛探索建模选择空间，进化算法（EA）阶段对最佳程序进行精细化迭代。实验表明，该框架能在不同数据模式上自动发现强性能模型，并已成功在线部署，线上桶级分析显示其在高价值和负LTV用户群体上提升了排序一致性和价值校准能力，为自动化建模提供了实用工具。

3. Learning to Collaborate via Structures: Cluster-Guided Item Alignment for Federated Recommendation

🔗 原文： https://arxiv.org/abs/2602.21957v1

🏷️ 来源： 🎓 学术界 | Beihang University, University of Technology Sydney, University of Edinburgh

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出用聚类标签替代嵌入传输的联邦推荐新范式，显著提升通信效率并保持推荐精度。

📝 摘要： 本文针对联邦推荐中同步高维物品嵌入导致通信开销大的问题，提出了“结构协作”的新视角，认为共享物品间的全局语义关系比强制坐标对齐更有效。据此，作者设计了Cluster-Guided FedRec框架，让服务器作为全局结构发现者，对聚合的嵌入进行聚类，并仅将离散的聚类标签分发给客户端，从而将通信复杂度从O(nd)降至O(n)。客户端利用这些标签构建对比损失，将本地物品表征与全局语义结构对齐。该方法在多个稀疏数据集上验证了其有效性，在保持甚至提升推荐精度的同时，大幅提高了通信效率，并对结合本地差分隐私时的正则化效应进行了探讨，为联邦推荐系统优化提供了新思路。

4. Offline Reasoning for Efficient Recommendation: LLM-Empowered Persona-Profiled Item Indexing

🔗 原文： https://arxiv.org/abs/2602.21756v1

🏷️ 来源： 🤝 产学合作 | Yonsei University, NAVER

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 提出LLM离线推理构建物品人格表示，实现高效可解释重排，延迟降低显著。

📝 摘要： 为解决LLM作为重排器时在线推理延迟高的问题，本文提出了Persona4Rec框架。其核心思想是将LLM的推理过程转移到离线阶段：利用LLM分析物品评论，为每个物品推理生成多个解释性、可读的“人格”表示，这些表示从不同用户动机角度刻画物品特性。在线服务时，系统预构建“人格画像”物品索引，通过轻量级编码器计算用户画像与物品最相关人格的匹配度，从而避免调用大模型进行实时推理。实验表明，该方法能达到与现有LLM重排器相近的性能，同时将推理延迟降低高达99.6%，并且在冷启动物品和可解释性方面表现出优势，为LLM在推荐系统中的高效落地提供了切实可行的方案。

5. AQR-HNSW: Accelerating Approximate Nearest Neighbor Search via Density-aware Quantization and Multi-stage Re-ranking

🔗 原文： https://arxiv.org/abs/2602.21600v1

🏷️ 来源： 🎓 学术界 | Arizona State University

⭐ 评分： ⭐⭐⭐ (3/5)

🎯 推荐理由： 针对HNSW向量检索的工程性能优化，提出密度感知量化与多阶段重排，显著提升QPS并降低内存。

📝 摘要： 本文针对推荐系统召回阶段广泛使用的HNSW向量检索算法面临的内存和计算瓶颈，提出了AQR-HNSW优化框架。该框架集成了三项关键技术：密度感知自适应量化，根据数据局部密度动态分配量化比特，实现4倍压缩的同时保持距离关系；多阶段重排与提前终止机制，减少高达35%的不必要计算；以及针对不同硬件架构的量化优化SIMD实现。在标准ANN基准测试中，该方法在保持98%以上召回率的前提下，实现了查询每秒（QPS）2.5-3.3倍的提升，索引图内存减少75%，索引构建速度提升5倍。这项工作直接优化了向量检索的基础设施性能，对构建十亿级别的大规模向量数据库具有明确的工程参考价值。