AI 技术日报 - 2026-01-27

本文是对 GPT-OSS 模型实施 Agentic RL 训练的深度实战回顾。文章详细拆解了训练过程中遇到的核心挑战,包括修复 PPO 算法中 MoE 专家对数概率不匹配的问题、纠正训练与推理阶段的不一致性。在性能优化方面,作者分享了如何集成 FlashAttentionV3 的注意力下沉支持,并利用 FSDP 内存优化与序列并行技术来提升训练效率。

AI 技术日报 - 2026-01-26

文章提出了一个开创性的概念“PkgFed”,旨在利用去中心化社交网络协议ActivityPub来构建联邦化的软件包发布生态系统。其核心是将包注册表映射为Mastodon实例、软件包映射为Actor、版本发布映射为Post,从而使传统的单向依赖关系转变为可双向查看和探索的社交图谱。这一设计能极大增强维护者对其用户基础的可见性,改进安全漏洞通知的传播效率,并促进跨Forgejo等联邦化代码托管平台的软

AI 技术日报 - 2026-01-25

今日收录 6 篇文章,精选 4 篇,另有 54 条 KOL 推文,覆盖 sebastianraschka、Towards Data Science、nesbitt、MarkTechPost、simonwillison 等来源。

AI 技术日报 - 2026-01-24

今日收录 10 篇文章,精选 9 篇,另有 11 条 KOL 推文,覆盖 simonwillison、aws、MarkTechPost、Towards Data Science、ai-news、openai blog 等来源。

推荐算法日报 - 2026-03-28

训练效率与成本优化:今日多篇论文聚焦于推荐系统开发中的效率瓶颈。从快手提出的持续数据集蒸馏(DIET)到针对LSR模型的GPU内核优化(Sparton),再到用线性复杂度算子(Hyena)替代注意力机制,核心目标都是降低大规模数据训练和迭代的算力与时间成本,这是工业界持续关注的核心痛点。; 稀疏与冷启动场景的表示学习:在数据稀疏的特定场景(如在线健康社区)和复杂的多行为推荐中,如何学习更鲁棒、更可解释的用户/物品表示是关键。今日论文通过引入伪标签辅助目标、因果干预与对比学习对齐等方法,旨在利用有

推荐算法日报 - 2026-03-27

工业界聚焦数据与架构协同设计:今日多篇工业界论文(快手、阿里、Meta)均强调,单纯扩大模型参数已进入收益递减阶段。核心创新转向数据与模型的协同优化,例如通过扩展训练信号(ES³)、挖掘潜在意图(OneSearch-V2)或设计更高效的架构(HHSFT)来突破性能瓶颈。; LLM推荐走向深度优化与对齐:LLM在推荐中的应用正从简单微调转向更精细的优化。研究重点包括:通过自蒸馏或强化学习对齐LLM与推荐目标(OneSearch-V2, SumRank),设计轻量级适配器以平衡性能与公平性(Ligh

推荐算法日报 - 2026-03-26

LLM Agent架构的工程化与规模化:今日多篇论文聚焦于将LLM作为智能代理(Agent)应用于推荐与搜索系统,并致力于解决其规模化部署的工程挑战。核心议题包括:如何为Agent从海量技能库中高效路由(SkillRouter)、如何设计低token复杂度的稳定架构以消除幻觉(RES)、以及如何自动化Agent驱动的模型研发流程(AI Co-Scientist)。这标志着LLM应用正从简单的提示工程迈向复杂、可扩展的系统工程。; 语义与协同信号的动态融合:在物品表示(如Semantic ID)和

推荐算法日报 - 2026-03-25

LLM驱动的推荐系统走向深度融合与工程化:今日论文显示,LLM在推荐中的应用已超越简单的文本理解,正与系统核心环节深度融合。从生成式推荐(GEM-Rec)到智能体框架(AgenticRec),再到检索优化(DSL-R1),LLM正被用于统一语义理解、商业逻辑与决策轨迹,标志着技术从“能用”向“好用、易部署”的工程化阶段迈进。; 稀疏与高效成为大规模检索的关键考量:无论是针对代码的SPLADE-Code模型实现亚毫秒级检索,还是ECI指标旨在降低硬负样本评估成本,亦或是TagLLM通过知识蒸馏提升

推荐算法日报 - 2026-03-24

📭 暂无数据:今日无精选论文更新,无法进行趋势分析。

推荐算法日报 - 2026-03-23

📭 今日无新论文:今日未收录新的推荐系统相关论文,技术趋势分析暂缺。

推荐算法日报 - 2026-03-22

📭 今日无更新:今日未收录新的精选论文,暂无法进行趋势分析。

推荐算法日报 - 2026-03-21

📭 今日无更新:今日未收录新的精选论文,暂无法进行趋势分析。

1
...
45678
...
11