推荐算法日报 - 2026-06-25
2026-6-24
| 2026-6-24
字数 1423阅读时长 4 分钟
type
Post
status
Published
date
Jun 24, 2026 16:08
slug
daily-report-2026-06-25
summary
LLM 蒸馏替代点击信号,重塑工业级召回训练范式:今日两篇来自 Walmart 的工业论文均采用 LLM 作为教师模型,生成结构化标注(相关性或意图),替代传统点击信号来训练双塔召回模型。这解决了点击信号中的位置偏差和长尾稀疏问题,并展示了显著的线上收益,标志着工业界正从“数据驱动”向“模型生成数据驱动”的范式转变。; 图基础模型(GFM)评估趋于理性,PFN 范式或成新方向:学术界对 GFM 的评估揭示了其并非普遍优于传统 GNN。只有基于 Prior-data Fitted Networks
tags
推荐系统
日报
category
推荐技术报告
icon
📚
password
priority
1

Section 1: 📊 Trend Analysis

  • 🔥 LLM 蒸馏替代点击信号,重塑工业级召回训练范式:今日两篇来自 Walmart 的工业论文均采用 LLM 作为教师模型,生成结构化标注(相关性或意图),替代传统点击信号来训练双塔召回模型。这解决了点击信号中的位置偏差和长尾稀疏问题,并展示了显著的线上收益,标志着工业界正从“数据驱动”向“模型生成数据驱动”的范式转变。
  • 💡 图基础模型(GFM)评估趋于理性,PFN 范式或成新方向:学术界对 GFM 的评估揭示了其并非普遍优于传统 GNN。只有基于 Prior-data Fitted Networks (PFN) 的最新模型在预测性能上胜出,但推理成本更高。这提醒工程师在引入 GFM 时需谨慎评估性价比,PFN 类模型可能成为未来图学习在推荐系统落地的新突破口。

Section 2: 📋 今日速览

  • Walmart Global Tech 在电商赞助搜索场景提出结构化挖掘+LLM级联标注+渐进式课程训练框架,用2.4亿条数据训练双塔BERT替代点击信号。线上A/B测试广告花费+2.80%,CTR+1.4%,长尾查询NDCG提升最大。
  • Walmart Global Tech 针对杂货搜索中短查询意图模糊问题,用LLM蒸馏出结构化意图属性(如饮食偏好),增强双塔召回模型。线上A/B测试广告收入+12.4%,展示了意图信号在召回阶段的巨大价值。
  • HSE University & Yandex Research 对9种图基础模型(GFM)进行公平评估,发现只有基于Prior-data Fitted Networks (PFN) 的模型在节点预测上优于调优后的GNN,但推理成本更高。为推荐系统中GNN选型提供了重要参考。

Section 3: 📰 Daily Digest

1. Scaling Dense Retrieval with LLM-Annotated Training Data: Structured Mining and Progressive Curriculum for E-Commerce Sponsored Search

🔗 原文: https://arxiv.org/abs/2606.23911
🏷️ 来源: 🏭 工业界 | Walmart Global Tech
⭐ 评分: ⭐⭐⭐⭐⭐ (5/5)
🎯 推荐理由: 用LLM标注替代点击信号,工业级检索系统显著提升。
📝 摘要: 本文针对电商赞助搜索中点击信号存在位置偏差、长尾查询稀疏的问题,提出了一套端到端流水线。核心创新在于:1)利用三个生产检索系统的分歧进行多通道挖掘,自动生成结构化训练信号(简单正例、困难正例、困难负例);2)通过校准的三模型级联(89.1%与人类标注者一致)进行分级相关性标注;3)设计三阶段渐进式课程训练,组织2.4亿+样本。在Walmart赞助搜索上部署的双塔BERT模型,离线NDCG@10提升5.1%,线上A/B测试(数千万广告请求/组)显示广告花费+2.80%、CTR+1.4%、eCPM+2.8%,且尴尬检索(评分为0)从8.7%降至3.5%,为工业界替换点击信号提供了可复制的蓝图。

2. INSPIRE: Intent-aware Neural Sponsored Product Retrieval for E-commerce

🔗 原文: https://arxiv.org/abs/2606.23889
🏷️ 来源: 🏭 工业界 | Walmart Global Tech
⭐ 评分: ⭐⭐⭐⭐ (4/5)
🎯 推荐理由: 用LLM蒸馏意图信号,提升电商搜索广告召回精度。
📝 摘要: 针对电商杂货搜索中查询短、歧义大、用户意图(如饮食偏好、尺寸)难以捕捉的问题,本文提出INSPIRE意图感知检索框架。核心思路是将意图表示为结构化多维属性(品牌、口味、饮食限制等),通过LLM教师从商品标题和描述中生成弱监督标注,再用LoRA微调轻量级学生LLM来预测意图。最终将这些预测意图融入双编码器(bi-encoder)的查询和商品表示中,实现更精准的匹配。该方法在Walmart搜索广告场景中,线上A/B测试报告广告收入提升12.4%,展示了结构化意图信号在召回阶段的巨大价值,对电商搜索广告从业者有直接借鉴意义。

3. A Fair Evaluation of Graph Foundation Models for Node Property Prediction

🔗 原文: https://arxiv.org/abs/2606.24509
🏷️ 来源: 🤝 产学合作 | HSE University, Yandex Research
⭐ 评分: ⭐⭐⭐ (3/5)
🎯 推荐理由: 公平评估图基础模型,揭示只有PFN类GFM优于GNN。
📝 摘要: 本文对9种最新的图基础模型(GFM)在节点属性预测任务上进行了公平且严格的重新评估,并与强GNN基线对比。核心发现是:在预测性能上,只有基于Prior-data Fitted Networks (PFN) 范式的最新GFM能够超越调优后的GNN,但代价是更高的推理成本。该研究揭示了当前GFM领域评估标准不统一的问题,并给出了一个清晰的结论:对于大多数推荐系统中的节点预测任务(如CTR预估),传统GNN仍是性价比之选,除非引入PFN类模型。这对工程师在技术选型时有重要的参考价值。
  • 推荐系统
  • 日报
  • OneTrans 推荐系统对齐序列处理与特征交叉AI 技术日报 - 2026-06-24
    Loading...