谷歌Gemini 1.5 Pro锐评Sora生成的,存诸多不合理之处

2024-02-19 12:51:53

  双方分别发布了各自的最新技术:谷歌推出 Gemini 1.5 Pro,OpenAI 则推出了文本转工具 Sora。Sora 的发布时机引发猜测,有人认为 OpenAI 是为了转移公众对谷歌 Gemini 1.5 的注意力。

  谷歌一位高管在 X 平台上分享了对 Sora 生成的详细分析,Gemini 1.5 Pro 以 Sora 生成的日本一条既有雪景又有樱花盛开的街道为例,指出存在明显不合理之处。

  根据 Gemini 1.5 Pro 的分析,大雪纷飞和盛开的樱花同时出现并不符合常理,因为樱花通常在春季开放,不会伴有降雪。而且雪的下落方式非常均匀,这不是现实生活中通常的降雪方式。此外,中的人物虽然身处大雪环境,却并未穿着任何冬装,这也显得非常违和。

  Gemini 1.5 在分析中总结道:“总而言之,这段虽然Sora 是一款能够生成长达 60 秒的文本转工具,可以创建包含细节丰富的场景、复杂摄像机运动以及具有丰富情感的多个人物画面,许多人将其称为生成领域的 “ChatGPT 时刻”。

  而谷歌的 Gemini 1.5 则拥有惊人的 100 万词条上下文窗口,远超 GPT-4 Turbo 的 12.8 万和 Anthropic Claude 2.1 的 20 万。这意味着它可以一次处理大量信息,包括 1 小时的、11 小时的音频以及超过 30,000 行代码或 70 万字的代码库。

下一篇:消息称三星正改善半导体封装工艺:非导电胶过渡至模塑底部填胶
上一篇:尚属首次,卫星在太空中收集太阳能并传回地球
返回顶部小火箭