推荐系统 20 年来方法换了六七轮,但问题定义从未改变——始终是预测下一个 item。缺多样性、缺发现性、规则泛滥,根源都在这里。真正的范式改变不是换方法,而是重新定义问题:从 Next One 到 Next N。
这不是一篇教大家怎么实操文章,不谈具体的工具和技术,我们来谈谈Vibe Coding的心法。 Vibe Coding 本质是利用 Agent 编码,Agent 背后是 LLM,LLM 是人类的”幽灵“,这出自 Karpathy 2025 年终总结**:”we're not evolving animals. We're summoning ghosts.“,**语言是人类世界的投影,LLM 是人类的幽灵。 工具和技术层出不穷,这是历史上从未出现过的新技术,没有人有经验。但是人性是一致的,拿捏住 Agent 的"人性",把 Agent 当人来管,会让Vibe Coding 从迷茫走向有迹可循。
NVIDIA 最近的博客文章显示,Blackwell Ultra 平台让 agentic AI 的推理成本相比 Hopper 时代下降了 35 倍(每 token 成本大幅崩盘),这不是孤立的巧合,而是符合 莱特定律(Wright's Law)的典型表现。
谜底就在谜面上。 "算法工程师",做个语法分析,这是个偏正结构。"算法"是定语,"工程师"才是中心语。定语修饰中心语,中心语决定你的身份。 算法工程师核心能力就是"工程能力"。 就像策略产品、用户产品、B端产品——核心都是产品能力。前面的定语告诉你在哪个领域工作,后面的中心语才是你安身立命的东西。 定语决定你的赛道,中心语决定你的天花板。
在和很多产品、运营团队合作的过程中,我常不得不扮演那个“泼冷水”的角色,特别是当大家对推荐算法寄予厚望的时候。 听到这样的战略规划:“我们明年目标是增长 80%,推荐系统是其中的关键。” 我的观点很直接:如果你的增长战略严重依赖推荐算法,一旦算法效果不及预期,目标就直接崩盘,那么这本质上是一个糟糕的战略**。对于规模增长,推荐算法不能雪中送炭,它只能在规模之上锦上添花。
本文不是从系统优化角度谈复杂的模型的部署和优化问题,而是从行业成本角度,看线上推理多复杂的模型是可以满足成本及ROI要求的。 做一个假设: • 电商推荐行业,主要是更熟悉成本核算 • 部署标准的Transformer作为排序模型,参考OneTrans结构 • 参数规模对齐qwen2的系列模型,更直观看看能跑哪个尺寸