今天读了《The Model is the Product(模型即产品)》,感触颇多。建议先读原文,再读下面内容。
这篇文章的核心观点是: AI 的下一个发展周期是专有化模型。专有化模型是针对特定任务训练的模型。比如:
- OpenAI 的 DeepResearch 是针对研究任务训练的模型。
- Claude 的 Sonnet 3.7 是针对复杂的代码开发任务训练的模型。
为什么是专有化模型?
- 通用模型已经到了瓶颈。GPT 4.5 的发布让我们感受到:模型能力呈现线性增长,但算力成本却呈指数级飙升。
- 特定任务的强化学习效果远超预期。DeepSeek 能有这么出色的推理能力,得益于强化学习。即使小模型在经过针对特定任务的强化学习后,也能在该任务上有出色的表现。
- 推理成本大幅下降。一些优化技术(如 DeepSeek 用的)让推理成本大幅下降。模型厂商通过卖 token 的商业模式难以维持。需要新的商业模式。专用模型可以用 SaaS 的商业模式。
专有化模型的优势:完成复杂的特定任务的效果好。专用模型通过针对特定任务的训练(通过反馈不断调整),习得了做这任务的“最佳实践”。当遇到新的任务时,它会自主决定实现过程。而这过程又是符合“最佳实践“的。
想象一下,人工能编排出 DeepResearch 这样效果的 Agent 吗?我觉得基本上是不可能的,要考虑太多的情况了。这个就像 AI 通过强化学习,玩游戏水平可以超过人类玩家,这个 AI 是不可能通过人工编排出来的。
当然,专有化模型也有缺点。最主要的缺点是,模型训练完后,不容易调整。如果任务发生变化,模型就需要重新训练。当然,训练专有模型还需要大量高质量的数据和算力,有一定的门槛。
因此,完成特定任务的逻辑是:
- 高频,复杂的任务,对效果要求高的,考虑用/训练 专用模型。
- 一些简单,自己擅长的场景,可以人工编排。比如用 Dify 的 Workflow 来编排。
文章认为: 模型本身已经成为产品本身,谁掌握模型训练,谁就掌握未来。谁知道呢?拭目以待吧。