训练成本不到50美元，研究人员打造出媲美 Open

2025-02-06 10:10:28

　　一份上周五发布的研究报告显示，斯坦福大学和华盛顿大学的人工智能研究人员仅花费不到 50 美元的云计算费用，就成功训练出一个具备“推理”能力的人工智能模型。

　　该模型名为 s1，s1 团队表示，类似 s1 模型的出现也引发了关于人工智能模型商品化的问题 —— 如果有人可以用相对较低的成本就能一个价值数百万美元的模型，那么大型科技公司的“护城河”在哪里呢？

　　不出所料，大型人工智能实验室对此并不满意，例如 OpenAI 此前就指责 DeepSeek 不当获取其 API 数据用于模型蒸馏。

　　s1 的研究人员希望找到实现强大推理性能和“测试时扩展”的最简单方法，这些是 OpenAI 的 o1 中的一些突破。

　　s1 的论文表明，谷歌通过其 Google AI Studio 平台免费提供 Gemini 2.0 Flash Thinking Experimental 模型的访问权限，但每天有使用限制。然而，其条款禁止对模型进行逆向工程，以开发与谷歌自身人工智能产品竞争的服务。

　　S1 基于阿里巴巴旗下中国人工智能实验室 Qwen 提供的一款小型、现成的免费人工智能模型。为了训练 s1，研究人员表示，研究人员使用了一个巧妙的技巧来让 s1 检查其工作并延长其“思考”时间：他们让它“等待”。论文显示，在 s1 的推理过程中添加“等待”一词，有助于模型获得稍微更准确的答案。