Reflection 70B AI 模型第三方基准测试结果不佳

2024-09-11 12:34:55

  对比平台 Artificial Analysis 相关数据表明,针对 AI 模型基准测试结果不佳,Reflection 公司首席执行官马特・舒默表示,上传模型权重至 Hugging Face 时遇到问题,所使用的权重是多个不同模型的混合体,而他们内部托管的模型则显示出更佳的结果。

  舒默随后向部分用户提供了独家访问内部模型的权限,Artificial Analysis 重做了测试,并报告结果优于公开 API,只是他们无法确认所访问的具体是哪个模型。

  Reflection 在 Hugging Face 已上传了新的模型,不过这些模型在测试中的表现明显逊于之前通过私有 API 提供的模型。

  查询公开资料,有用户还发现了证据,表明 Reflection API 有时会调用 Anthropic Claude 3.5 Sonnet以及OpenAI。

  舒默旗下公司 OthersideAI 此前已宣布计划于本周发布一款基于 LLaMA 3.1 450B 的更大、更强大的模型。

  舒默对这一即将发布的版本做出了大胆官方回应:

下一篇:马斯克:特斯拉明年末批量装备 Dojo 2,对标英伟
上一篇:亚马逊 AWS 未来 5 年在英投资 80 亿英镑,强化数
返回顶部小火箭