AI 技术日报 - 2026-01-29

文章深刻剖析了数字主权中常被忽视的“依赖层”问题,指出欧洲不应简单重复建设类似AWS的基础设施,而应通过制定和推广开放标准(如S3 API)来降低技术切换成本。核心发现是,即使代码自托管,欧洲公司仍严重依赖美国主导的软件供应链服务,如代码托管(GitHub)、依赖智能(Dependabot)和包注册表(npm)。文章提出通过标准化协议(如PURL、OSV、CycloneDX)解耦包管理器组件,并建

AI 技术日报 - 2026-01-28

DSGym 是一个由斯坦福大学、Together AI 等机构提出的框架,用于标准化地评估和训练数据科学 Agent。它通过容器化环境封装了超过 1,000 个数据科学挑战,并引入了 DSBio(生物信息学)和 DSPredict(Kaggle 预测)等新数据集。评估发现,前沿模型在一般分析任务上表现良好(60%-90%准确率),但在 DSBio 上因“领域接地错误”而性能骤降(最佳仅 43.33

AI 技术日报 - 2026-01-27

本文是对 GPT-OSS 模型实施 Agentic RL 训练的深度实战回顾。文章详细拆解了训练过程中遇到的核心挑战,包括修复 PPO 算法中 MoE 专家对数概率不匹配的问题、纠正训练与推理阶段的不一致性。在性能优化方面,作者分享了如何集成 FlashAttentionV3 的注意力下沉支持,并利用 FSDP 内存优化与序列并行技术来提升训练效率。

AI 技术日报 - 2026-01-26

文章提出了一个开创性的概念“PkgFed”,旨在利用去中心化社交网络协议ActivityPub来构建联邦化的软件包发布生态系统。其核心是将包注册表映射为Mastodon实例、软件包映射为Actor、版本发布映射为Post,从而使传统的单向依赖关系转变为可双向查看和探索的社交图谱。这一设计能极大增强维护者对其用户基础的可见性,改进安全漏洞通知的传播效率,并促进跨Forgejo等联邦化代码托管平台的软

AI 技术日报 - 2026-01-25

今日收录 6 篇文章,精选 4 篇,另有 54 条 KOL 推文,覆盖 sebastianraschka、Towards Data Science、nesbitt、MarkTechPost、simonwillison 等来源。

AI 技术日报 - 2026-01-24

今日收录 10 篇文章,精选 9 篇,另有 11 条 KOL 推文,覆盖 simonwillison、aws、MarkTechPost、Towards Data Science、ai-news、openai blog 等来源。