AI 技术日报 - 2026-02-20

MIT 研究发现,顶级 AI 聊天机器人(如 GPT-4、Claude 3 Opus、Llama 3)对弱势用户(如低英语水平、低教育背景、非美国用户)提供的信息准确性更低,且拒绝回答率更高。研究使用 TruthfulQA 和 SciQ 数据集,发现当用户特质叠加时(如低教育背景的伊朗用户),偏见更为严重。例如,Claude 3 Opus 在对低教育用户拒绝回答时,有 43.7% 使用了居高临下的

AI 技术日报 - 2026-02-19

本文详细介绍了如何利用 Amazon Bedrock AgentCore 构建一个名为 CAKE 的多 Agent 客户智能系统。系统采用 Supervisor Agent 进行意图分析和并行调度,协调多个专用工具(如 Neptune 图查询、DynamoDB 指标查找、OpenSearch 语义搜索)来获取客户全景信息。核心亮点包括:在 Neptune 中构建销售知识图谱以支持基于 GraphR

AI 技术日报 - 2026-02-18

文章详细报道了印度四大IT服务巨头(Infosys, Persistent, Tech Mahindra, Wipro)基于NVIDIA技术构建企业级AI Agent的实践。案例具体且数据详实:Wipro的客服平台已处理42%的呼入电话,支持900路并发;Tech Mahindra开发了用于自主网络运维的大型电信模型;Infosys训练了25亿参数的编码小模型;Persistent则利用BioNe

AI 技术日报 - 2026-02-17

阿里巴巴 Qwen 团队发布了新一代大型语言模型 Qwen3.5,其旗舰版本 Qwen3.5-397B-A17B 采用稀疏混合专家(MoE)架构,总参数量达 397B,但每次前向传播仅激活 17B 参数,在保持 400B 级别模型智能的同时,实现了接近小型模型的推理速度。模型采用创新的高效混合架构,结合门控 Delta 网络(线性注意力)和 MoE 块交替布局,并作为原生视觉语言模型通过早期融合训

AI 技术日报 - 2026-02-16

今日收录 7 篇文章,精选 3 篇,另有 19 条 KOL 推文,覆盖 MarkTechPost、sujianlin、simonwillison、ML Techniques 等来源。

AI 技术日报 - 2026-02-15

今日收录 3 篇文章,精选 2 篇,另有 46 条 KOL 推文,覆盖 MarkTechPost、sciencedaily、simonwillison 等来源。

AI 技术日报 - 2026-02-14

今日收录 18 篇文章,精选 9 篇,另有 13 条 KOL 推文,覆盖 AWS、OpenAI Blog、MarkTechPost、ai-news 等来源。

AI 技术日报 - 2026-02-13

OpenAI 发布了专注于极致速度的 AI 编程模型 GPT-5.3-Codex-Spark 研究预览版。其核心突破在于性能:比旗舰版 GPT-5.3-Codex 快 15 倍,每秒生成超过 1000 个 token,实现近乎实时的代码生成。这一成就得益于与 Cerebras 的深度合作,首次采用其 Wafer-Scale Engine 3 (WSE-3) 单晶圆级芯片,消除了传统 GPU 集群间

AI 技术日报 - 2026-02-12

Meta 提出了一种名为 Just-in-Time Tests (JiTTests) 的创新测试方法,旨在应对 AI 驱动的 Agentic 开发对传统测试的挑战。其核心在于利用 LLM 在代码提交时实时生成测试用例,这些测试针对特定代码变更定制,无需维护庞大的静态测试套件。系统能推断开发者的变更意图,并生成“变异体”来模拟潜在故障,再结合基于规则和 LLM 的评估器来最大化测试价值、最小化误报。

AI 技术日报 - 2026-02-11

文章深度剖析了软件包管理中“vendoring”(将依赖代码直接复制到项目)的衰落与“lockfiles”(锁文件)的崛起。核心观点是,Git 的克隆机制使 vendoring 的成本(巨大的仓库体积和历史)显性化,恶化了开发者体验。而 lockfiles(如 Gemfile.lock)结合中央注册表和内容哈希,提供了无需存储代码的可重复构建。文章还分析了 left-pad 事件如何推动行业加强注

AI 技术日报 - 2026-02-10

Meta 详细揭秘了其千兆瓦级 AI 集群 “Prometheus” 的核心网络架构——后端聚合(BAG)层。BAG 作为一个集中式的以太网超级骨干,连接多个数据中心和区域,旨在提供宠物比特级(如 16-48 Pbps)的带宽。文章深入探讨了其模块化硬件(基于 Jericho3 ASIC)、两种拓扑设计(平面与扩展连接以平衡性能与弹性)、关键的管理过订阅比率(L2 到 BAG 约 4.5:1),以

AI 技术日报 - 2026-02-09

字节跳动开源了生物分子结构预测模型 Protenix-v1,其在训练数据截止日期(2021-09-30)、模型规模(3.68亿参数)和推理预算上严格对齐 AlphaFold3 (AF3) 的条件下,实现了与 AF3 相当的性能,覆盖蛋白质、DNA、RNA 和配体。模型采用 AF3 风格的扩散架构,并提供了完整的训练/推理代码、预训练权重及数据管道。同时发布的 PXMeter v1.0.0 评估工具

1
...
45678
...
13