训练成本不到50美元,研究人员打造出媲美 Open
一份上周五发布的研究报告显示,斯坦福大学和华盛顿大学的人工智能研究人员仅花费不到 50 美元的云计算费用,就成功训练出一个具备“推理”能力的人工智能模型。
该模型名为 s1,s1 团队表示,类似 s1 模型的出现也引发了关于人工智能模型商品化的问题 —— 如果有人可以用相对较低的成本就能一个价值数百万美元的模型,那么大型科技公司的“护城河”在哪里呢?
不出所料,大型人工智能实验室对此并不满意,例如 OpenAI 此前就指责 DeepSeek 不当获取其 API 数据用于模型蒸馏。
s1 的研究人员希望找到实现强大推理性能和“测试时扩展”的最简单方法,这些是 OpenAI 的 o1 中的一些突破。
s1 的论文表明,谷歌通过其 Google AI Studio 平台免费提供 Gemini 2.0 Flash Thinking Experimental 模型的访问权限,但每天有使用限制。然而,其条款禁止对模型进行逆向工程,以开发与谷歌自身人工智能产品竞争的服务。
S1 基于阿里巴巴旗下中国人工智能实验室 Qwen 提供的一款小型、现成的免费人工智能模型。为了训练 s1,研究人员表示,研究人员使用了一个巧妙的技巧来让 s1 检查其工作并延长其“思考”时间:他们让它“等待”。论文显示,在 s1 的推理过程中添加“等待”一词,有助于模型获得稍微更准确的答案。