推荐周报 2026-W09

本周共收录 23 篇推荐系统相关论文,其中 5 分论文 5 篇,4 分 10 篇,3 分 8 篇,整体质量出色。Generative Recommendation(生成式推荐) 是本周最显著的技术主线,6 篇论文直接聚焦于此,涵盖 Semantic ID 编码、受限解码优化、广告场景部署和多任务统一框架。另一条主线是 LLM 与推荐系统的融合范式——"LLM-as-Rec"(LLM 作为推荐骨干)与"LLM-for-Rec"(LLM 辅助推荐)两条路径本周都有重要进展。工业部署论文占比极高(6 篇含 Online A/B 测试),来自 AliExpress、快手、Apple App Store 等一线平台。

AI 技术日报 - 2026-03-01

今日内容跨越官方博客、技术教程、GitHub项目、播客及X平台动态,核心焦点在于AI智能体工程实践的深化与AI公司与政府合作的伦理政策博弈。一方面,开发者社区正通过设计模式、交互式解释和新型工具链来提升智能体的可维护性与协作效率;另一方面,OpenAI与Anthropic在国防合作上的不同境遇,引发了关于AI安全红线与商业策略的广泛讨论。 精选文章:5篇(1篇4分,4篇3分) GitHub热门项目:5个(1个5分,4个4分) 播客精选:1集(4分) X推文动态:25条(来自20位作者)

AI 技术日报 - 2026-02-28

今日内容跨越博客、GitHub、播客及X平台,揭示了AI领域在资本、技术与治理层面的激烈碰撞。核心亮点包括:AI基础设施的千亿级资本竞赛、多智能体框架的成熟化趋势,以及AI安全评估与地缘政治交织的复杂议题。从OpenAI的巨额融资到开源模型可能面临的监管收紧,从业者正站在一个技术加速与规则重塑的十字路口。 精选文章:5篇(4分文章2篇,3分文章3篇) GitHub热门项目:5个(5分项目4个,4分项目1个) 播客精选:3集(均为4分) X推文动态:25条,来自23位作者

AI周报 2026-W08

本周 AI 领域最突出的特征是一种"同步加速":资本、模型、基础设施和研究同时进入新的量级。OpenAI 宣布了史上最大规模的 1100 亿美元融资,NVIDIA 以 300 亿美元直接入股,Anthropic 刚刚完成 300 亿美元 G 轮——三天内流入 AI 头部公司的资本超过 1400 亿美元。与此同时,Qwen3.5-397B、Claude Sonnet 4.6、Gemini 3.1 Pro 三款旗舰模型在同一周内发布,形成了一场罕见的三方对决。 但真正值得关注的变化发生在水面之下。微软、Cloudflare、GitHub、HuggingFace 在同一周内集中发布 Agent 基础设施框架,标志着行业重心正从"更强的模型"转向"更可靠的 Agent 系统"。与此形成尖锐对照的是,五篇安全研究论文从几何、结构、模态三个维度共同揭示了当前 LLM 安全对齐的根本性脆弱。在 Agent 即将大规模部署的节点上,这一矛盾格外刺眼。

AI 技术日报 - 2026-02-27

今日内容跨越博客文章、GitHub热门项目、深度播客及X平台动态,核心趋势聚焦于AI Agent的实用化演进与基础设施的深层变革。一方面,从微软的CORPGEN框架到个人代码片段积累,Agent正从概念走向解决实际工作流问题;另一方面,资本涌入、硬件预装与开源模型/框架的突破,共同塑造着AI发展的底层格局。 精选文章:5篇(4分2篇,3分3篇) GitHub项目:5个(均为5分) 播客精选:3集(5分1集,4分2集) X推文动态:25条

AI 技术日报 - 2026-02-26

今日内容跨越博客、GitHub项目、学术论文、播客及社交媒体,全景式展现了AI领域的技术演进与行业动态。核心亮点在于:开源模型架构进入“春秋战国”时代,混合专家(MoE)与多样化注意力机制成为主流;AI Agent正从概念验证迈向工程化与标准化,多智能体编排平台和官方技能库涌现;同时,无需外部奖励的测试时优化和动态注意力解码等前沿研究,为提升模型能力开辟了新路径。 精选文章: 5篇(5分1篇,4分4篇) GitHub项目: 5个(5分2个,4分3个) 精选论文: 2篇(4分2篇) 播客精选: 2集(4分2集) X推文动态: 25条

AI 技术日报 - 2026-02-25

今日内容跨越博客文章、GitHub项目、学术论文、播客及X平台动态,核心亮点在于AI工程化的深度实践与基础设施瓶颈的集中讨论。一方面,从多Agent工作流设计、GPU通信优化到推理加速,工程落地成为焦点;另一方面,内存短缺、地缘政治与数据版权等宏观约束正深刻影响技术发展路径。 精选文章:5篇(均为4分) GitHub项目:4个(均为4分) 精选论文:5篇(均为4分) 播客精选:1集(4分) X推文动态:25条

AI 技术日报 - 2026-02-24

今日内容跨越博客文章、GitHub项目、学术论文、播客及X平台动态,展现了AI领域在工程化部署、评估基准演进、安全风险与智能体规模化等多个维度的活跃进展。核心亮点包括:OpenAI弃用饱和的SWE-Bench基准引发对评估可靠性的反思;Anthropic指控竞争对手发起大规模“蒸馏攻击”凸显数据安全与竞争伦理;同时,一系列开源框架和工具(如Agno、BlenderMCP)正致力于降低智能体与多模态应用的开发门槛。 精选文章:5篇(均为4分) GitHub项目:5个(1个5分,4个4分) 精选论文:3篇(均为4分) 播客精选:1集(4分) X推文动态:25条

AI 技术日报 - 2026-02-23

今日内容跨越了技术博客、学术综述、行业洞察与社交媒体讨论,核心聚焦于提升AI系统效率与应对规模化部署带来的新挑战。一方面,从多模态Token压缩到极致非对称检索模型,技术前沿正致力于解决计算瓶颈;另一方面,AI代理的广泛应用引发了安全债务、市场失衡与治理信任等深层问题。今日精选了5篇高分文章,并汇总了25条来自AI领域KOL的推文动态,共同勾勒出当前AI发展的关键脉络。 *数据统计:精选文章 5 篇(5分1篇,4分4篇)、X 推文 25 条。

AI 技术日报 - 2026-02-22

今日内容跨越技术博客、GitHub热门项目及X平台动态,核心趋势聚焦于AI智能体(Agent)的全面爆发与基础设施成熟。从开源框架、企业级部署到安全威胁与前沿应用,智能体正从概念走向落地。同时,模型性能竞赛与成本效益、AI安全新威胁以及去中心化AI的潜力也备受关注。 精选文章:5篇(均为4星) GitHub热门项目:5个(2个5星,3个4星) X推文动态:25条(整理为4个主题)

AI 技术日报 - 2026-02-21

NVIDIA 开源了机器人世界模型 DreamDojo,它通过 44,711 小时的人类第一人称视频进行预训练,旨在解决机器人模拟的数据稀缺问题。其核心技术包括:使用时空 Transformer VAE 提取连续潜在动作作为硬件无关的控制接口;采用 Cosmos-Predict2.5 架构优化物理正确性;并通过 Self Forcing 蒸馏将推理速度提升至 10.81 FPS,支持实时交互。在下

AI 技术日报 - 2026-02-20

MIT 研究发现,顶级 AI 聊天机器人(如 GPT-4、Claude 3 Opus、Llama 3)对弱势用户(如低英语水平、低教育背景、非美国用户)提供的信息准确性更低,且拒绝回答率更高。研究使用 TruthfulQA 和 SciQ 数据集,发现当用户特质叠加时(如低教育背景的伊朗用户),偏见更为严重。例如,Claude 3 Opus 在对低教育用户拒绝回答时,有 43.7% 使用了居高临下的

1
...
34567
...
13