AI 技术日报 - 2026-05-26

今日 AI 领域迎来多个里程碑:OpenAI 与 DeepMind 双线攻克 80 年未解数学难题,标志 LLM 推理能力质变。同时 HRM-Text 以 1500 美元成本挑战 Scaling Law,DeepSeek 永久降价 75% 至 GPT-5.5 的 1/9,行业从“算力军备竞赛”转向“效率与成本竞争”。Agent 生态全面走向生产级,AWS MCP Server 正式 GA、auth.md 认证协议发布、微软 SkillOpt 提出系统化技能优化。中国 AI 模型周使用量连续四周超美国,DeepSeek-V4-Flash 居榜首。

AI 技术日报 - 2026-05-25

今日日报跨越博客、GitHub 项目、播客与 KOL 推文,核心亮点在于AI 对就业与组织架构的深层冲击:一方面,历史数据挑战“AI 消灭岗位”的简单叙事,提出自动化可能因价格弹性增加岗位的反直觉观点;另一方面,实战案例显示 AI-First 组织已实现 99% 代码由 AI 完成,引发对信任、角色与效率的重新思考。此外,DeepMind Agent 自主解决数学难题、微软因成本禁止内部使用 Claude Code 等事件,共同勾勒出 AI 从工具到生产力的加速渗透与阵痛。 精选文章 2 篇、GitHub 项目 2 个、播客 1 集、KOL 推文 23 条

AI 技术日报 - 2026-05-24

今日日报跨越博客、GitHub 项目、KOL 推文三大数据源,核心趋势是“模型实验室集体转向 Agent 产品”,同时 Agent 的记忆、训练和安全工具链迎来密集发布。腾讯开源了 4 层记忆管道,Pydantic 和 CrewAI 等成熟框架持续领跑,vLLM 社区则因虚假 PR 事件引发对 AI 编码 Agent 维护成本的讨论。 *数据统计: 精选文章 3 篇、GitHub 项目 4 个、KOL 推文 12 条(合并后)。

AI 技术日报 - 2026-05-23

今日日报跨越博客、GitHub 项目、播客和 KOL 推文四大数据源,核心亮点是 AI 对硬件供应链的挤压效应 和 Agent 工程从框架到治理的全面成熟。内存短缺导致消费电子涨价,同时微软推出 Agent 治理工具包,标志着 Agent 应用进入企业级安全部署阶段。 精选文章 5 篇、GitHub 项目 2 个、播客 2 集、KOL 推文 19 条

推荐算法日报 - 2026-05-23

LLM 从“辅助”走向“核心”:今日多篇工业界论文(Meta、Airbnb、快手)不再将LLM作为特征提取的辅助工具,而是将其作为推荐系统的核心推理引擎,用于生成语义表示、合成训练数据、甚至直接进行推理与检索,标志着LLM在推荐系统中的应用进入新阶段。; 强化学习成为LLM推荐对齐的关键技术:无论是快手的RPORec还是山东大学的ThinkGR,都采用了强化学习(PPO)来微调LLM,使其推理过程与推荐目标(如精确检索、多跳推理)对齐。这表明RLHF的思路正在从对话系统向推荐系统迁移,是提升LL

AI 技术日报 - 2026-05-22

今日日报跨越博客、GitHub 项目、论文、KOL 推文和播客五大数据源,核心亮点是 Agent 基础设施的全面爆发。从微软、Google 到开源社区,多款面向 Agent 的计算、编排和管理工具集中发布;同时,阿里 Qwen3.7-Max 的发布和 OpenAI Codex 的更新也展示了前沿模型的 Agent 能力。今日共收录精选文章 5 篇、GitHub 项目 5 个、播客 4 集、KOL 推文 30 条。

推荐算法日报 - 2026-05-22

去偏与鲁棒性成为精排核心战场:今日多篇论文聚焦于解决推荐系统中的偏差问题,包括隐式反馈的标签噪声(RGBT)、未观测混杂因素(PUID)以及子空间漂移(Moving Subspace)。这表明工业界和学术界正从简单的纠偏方法,转向更精细、更鲁棒的个性化去偏框架,以提升模型在真实噪声环境下的泛化能力。; 效率优化与理论分析并重:工业界论文(Amazon LTC)通过层间自适应Token压缩,在保持排序质量的同时大幅提升推理QPS,体现了工业场景对效率的极致追求。同时,学术界论文(ReMax Ban

AI 技术日报 - 2026-05-21

今日日报跨越了博客、GitHub、论文、KOL 推文和播客五大信源,核心亮点是 Google I/O 2026 的 AI 战略发布与 Agent 基础设施的全面爆发。Google 发布了 Gemini 3.5 Flash、Omni 等多模态模型,而 Karpathy 的 `autoresearch`、火山引擎的 `OpenViking` 等项目则标志着 Agent 正从应用层渗透到研发和基础设施层。此外,OpenAI 模型首次独立攻克数学开放猜想,成为今日最受关注的里程碑事件。 精选文章:5 篇 GitHub 热门项目:5 个 播客精选:1 集 KOL 推文:30 条

推荐算法日报 - 2026-05-21

LLM与推荐系统的深度融合进入精细化阶段:今日多篇论文(LWGR、ABPO、RecoAtlas)不再满足于简单地将LLM作为特征提取器或排序模型,而是深入探索如何利用LLM的世界知识、处理其特有的反馈偏差(如曝光偏差、反馈模糊性),并设计专门的评估框架。这表明LLM推荐正从“能不能用”走向“如何用好”的精细化工程阶段。; 不确定性建模与鲁棒性成为核心关注点:BFT从贝叶斯视角统一Transformer的不确定性,MDCNS通过多源负采样打破自强化循环,BoR指标揭示高召回率下的随机性陷阱。这些工

AI 技术日报 - 2026-05-20

今日 AI 领域迎来重磅发布潮,以 Google I/O 2026 为核心,Gemini 3.5 系列模型、Gemini Omni 及 Managed Agents 等产品正式亮相,标志着 AI 正式进入“Agentic”时代。同时,社区围绕 Agent 生态、成本优化和工具链展开了密集讨论。本期日报精选 5 篇深度文章、5 个 GitHub 热门项目,并收录了 28 条 KOL 推文,全面覆盖从模型发布到落地实践的各个维度。

推荐算法日报 - 2026-05-20

生成式推荐与语义索引的深化应用:今日有多篇论文围绕生成式推荐(Generative Recommenders)展开,从淘宝的GrowthGR到中南大学的Ghost,均采用或分析了基于语义ID的生成式检索架构。趋势表明,业界正从传统的向量检索向更统一的、端到端的生成式范式迁移,但随之而来的流行度偏差、冷启动等问题也成为新的研究焦点。; 多目标与长期价值的精细化建模:工业界论文普遍关注如何超越短期指标(如点击率),建模长期用户价值与平台生态健康。淘宝的GrowthGR通过反事实推断量化商品长期交易价

AI 技术日报 - 2026-05-19

今日 AI 日报跨越博客、GitHub 项目、论文、KOL 推文和播客五大数据源,核心亮点是 Agent 系统从评估、工程化到专用硬件的全栈成熟。IBM 与 Hugging Face 联合发布 Open Agent Leaderboard 开启通用 Agent 评估新纪元,NVIDIA 首款 Agent 专用 CPU Vera 交付头部实验室,同时社区涌现出 12-Factor Agents 等工程化原则和 Cognee 等记忆管理工具。今日共收录:精选文章 5 篇、GitHub 项目 5 个、播客 1 集、KOL 推文 31 条。

1
...
34567
...
18