Claude Code 使用技巧与 Agentic Engineering

从 Vibe Coding 到 Agentic Engineering 的演进,系统梳理 Claude Code 命令体系、Skills 系统、Hooks、Subagents、MCP 服务器、辅助工具生态及核心工作流。

生成式推荐 (Generative Recommendation) 工业界深度 Survey

覆盖 101 篇核心论文(58 篇工业界 + 43 篇学术精选),系统梳理 2022-2026 年生成式推荐从学术概念到工业主流范式的完整技术演进。以 TIGER、HSTU、OneRec 等里程碑论文为核心,深入分析 Semantic ID、模型架构、训练范式、推理增强、长序列建模等关键技术方向。

AI 技术日报 - 2026-03-27

今日内容跨越博客文章、GitHub项目、播客及X平台动态,核心趋势聚焦于AI智能体(Agent)基础设施的快速演进与多模态交互能力的深化。从Stripe等公司推出CLI工具简化Agent配置,到微软发布视觉交互规划基准,再到Google推出实时多模态语音模型,均指向Agent正从概念走向实用,其工具链和感知能力成为竞争焦点。今日精选文章5篇、GitHub项目5个、播客1集、X推文24条。

AI 技术日报 - 2026-03-26

今日内容跨越了博客文章、GitHub项目、AI播客及X平台推文,核心趋势聚焦于智能体(Agent)能力的深度扩展与风险反思,以及基础设施与边缘计算的演进。一方面,智能体正从简单的代码生成向自动化办公、跨链操作、科学发现等复杂任务迈进,但同时也引发了关于开发速度与代码质量的“认知债务”担忧。另一方面,从英伟达的万亿收入预期到边缘AI的落地挑战,算力与部署的讨论持续深入。 精选文章:5篇(1篇4分,4篇3分) GitHub热门项目:4个(均为4分) X推文动态:24条 播客精选:2集(均为4分)

AI 技术日报 - 2026-03-25

今日内容跨越博客文章、GitHub项目、播客及X推文,核心亮点聚焦于AI Agent生态的安全风险与生产级工具链的成熟。一方面,LiteLLM供应链攻击事件揭示了AI基础设施的脆弱性;另一方面,多个高星GitHub项目展示了多Agent编排、安全测试、记忆管理等领域的专业化、生产就绪解决方案。同时,Claude Code等工具的功能更新和跨平台集成,标志着AI辅助开发正从实验走向深度工作流融合。 精选文章:5篇(4分文章2篇,3分文章3篇) GitHub项目:5个(5分项目4个,4分项目1个) 播客单集:1集(4分) X推文:24条

AI 技术日报 - 2026-03-24

今日内容跨越博客文章、GitHub项目、AI播客及X平台推文,核心围绕AI Agent的实践、评估与生态构建展开。从Meta收购Dreamer团队到OpenAI宣布构建自主AI研究员,再到多个开源Agent框架的涌现,智能体技术正从概念验证加速迈向规模化应用与深度集成。同时,多模态模型(如Luma的Uni-1)的竞争与AI基础设施(如NVIDIA的扩展定律)的讨论也持续升温。 精选文章:5篇(4分1篇,3分4篇) GitHub热门项目:5个(5分1个,4分4个) AI播客精选:1集(5分) X推文动态:24条(整理为18条摘要)

AI 技术日报 - 2026-03-23

今日内容跨越博客文章、X推文和GitHub热门项目,核心趋势聚焦于AI Agent技术的深度实践与生态扩张。从企业级平台合作到开源技能库,从沙箱化安全实践到多智能体协作框架,AI从业者正从理论探讨转向复杂系统的工程化落地。今日精选文章5篇、GitHub项目5个、X推文动态24条。

AI 技术日报 - 2026-03-22

今日内容跨越博客文章、GitHub热门项目及X平台推文,核心聚焦于AI智能体(Agent)的“具身化”与工程化落地。从超越人类性能的计算机使用智能体,到将Git、文档处理等传统工具无缝集成进AI工作流的实践,再到各大公司围绕自主智能体展开的长期战略布局,技术趋势正从模型能力竞赛转向构建可执行、可协作的完整系统。今日精选文章5篇、GitHub项目4个、X推文24条。

推荐周报 2026-W12

本周推荐系统研究围绕三条技术主线展开。第一条是 Semantic ID 驱动的生成式检索持续升温——Spotify 同时放出两篇论文,一篇将 SID 系统部署上线并跑通 A/B test(新节目发现率 +14.3%),另一篇将 SID 作为独立模态统一搜索、推荐和推理,工业界 SID 系统正从"能不能用"进入"怎么用得更好"的阶段。第二条是多模态检索与表示压缩:Apple 交出统一文本/图像/视频的生产级检索架构,Aalto University 将 2B 参数的 VLM 蒸馏为 69M 的文本编码器(延迟降低 50 倍),POSTECH 发现并修复了 VLM embedder 做推荐时的模态崩溃问题。 第三条是工业级精排的信息流控制。阿里巴巴和 Meta 的三篇论文从不同角度切入同一命题——不再无差别地喂入所有特征和信号,而是控制特征参与交互的时机(延迟掩码)、筛选值得精细交互的行为(核心行为选择)、标准化行为信号的分布语义(条件去偏)。Meta 的 MBD 框架尤其值得关注,已部署在两个十亿级用户的短视频平台上,将观看时长与视频时长的相关性从 0.514 压到 0.003。

AI 技术日报 - 2026-03-21

今日内容跨越博客文章、GitHub项目、播客及X平台推文,核心趋势聚焦于AI Agent的工程化与生态竞争。从大厂收购开发者工具、发布企业级框架,到开源社区涌现的包管理器、技能库和调试指南,整个行业正从模型能力竞赛转向构建稳定、可复现的Agent工作流和开发者平台。同时,多模态推理、AI在垂直领域的应用(如会计自动化)以及关于AI认知影响的讨论也备受关注。 精选文章:5篇(均为4分) GitHub热门项目:5个(5分项目2个,4分项目3个) 播客精选:4集(5分1集,4分2集,3分1集) X推文动态:24条(涵盖热点、工具、技术实践)

AI周报 2026-W12

如果要用一个词概括 2026-W12 的 AI 领域,那就是"基础设施"——不是模型本身,而是让模型在真实世界中运转起来的一切。Simon Willison 将过去一年间散落的 Agent 工程经验凝结为一套完整的模式指南,Stratechery 宣称 Agent 是大语言模型的第三个范式转折点,OpenAI 十天内连续收购 Promptfoo 和 Astral 补齐编码 Agent 的环境管理短板,Stripe 推出机器支付协议 MPP 让 Agent 可以自主花钱——整个行业正在从"Agent 能做什么"快速切换到"Agent 如何在生产环境中可靠、安全、经济地运行"。 模型层面同样以"适配 Agent"为主旋律。OpenAI 的 GPT-5.4 mini/nano 不是旗舰的缩小版,而是从一开始就按"被调用"来设计的子代理模型;MiniMax M2.7 以 GLM-5 三分之一的成本达到同等性能;Mamba-3 从 SSM 架构层面为高并发 Agent 场景铺设基础。竞争维度正从"谁最聪明"转向"谁最适合被编排"。 与此同时,Meta 的 Ranking Engineer Agent 交出了模型准确率翻倍的成绩单,但同一周 Meta 也遭遇了 Sev 1 级别的 Agent 数据泄露事件。ServiceNow 的企业级 Agent 基准显示,当前最强模型在仿真企业环境中的成功率仅 37.4%。产出与风险并存,这正是 Agentic Engineering 当前最真实的写照。

AI 技术日报 - 2026-03-20

今日内容跨越了博客文章、GitHub热门项目和X平台动态,核心聚焦于AI Agent(智能体) 的工程化、安全与生态整合。从OpenAI收购Astral补齐编码环境短板,到阿里开源通用沙箱平台,再到GitHub分享多Agent协同的“反直觉”设计,行业正从模型能力竞赛转向Agent基础设施与工作流的构建。今日精选文章5篇、GitHub项目5个、X推文24条。