Arena Elo 基准测试:谷歌Gemini 1.5 Pro性能媲美 Ope

2024-05-30 11:06:00

  谷歌在 I / O 2024 开发者大会上,宣布将 Gemini 1.5 Pro 上下文窗口增加至 200 万个tokens,根据 LMSYS Org 公布的总排行榜对比,通过 Arena Elo 系统的测量,Gemini-1.5-Pro-API-0514 和 Gemini-Advanced-0514 都接近 GPT-4o。

  上述两款模型在中文方面的表现也非常游戏,Gemini 1.5 Pro 在“hard prompts”类别中也非常接近。

  注:Arena Elo 系统通过让用户匿名投票决定哪个模型在随机对战中表现更好来衡量大型语言模型的技能,并像国际象棋中的 Elo 系统一样更新用户的评分,整体而言更加客观。

下一篇:Frore 将参加 2024 台北电脑展,展出多款 AirJet 散热
上一篇:智己汽车与蔚来能源达成充电互联互通合作
返回顶部小火箭