谷歌推出 Gemini 1.5 Pro 公共预览版，现已支持处理

2024-04-10 02:04:24

　　谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini1.5 Pro。

　　谷歌现已推出 Gemini 1.5 Pro 公共预览版，并借此为其赋予了“耳朵”，从而帮助用户处理音频内容，例如可以直接上传一份音频文件让它来分析，或者上传一份财报电话会议录音或来让它总结。

　　据称，这个 Gemini系列中定位“中量级”模型的版本在性能上已经超越了自家更大的模型 ——GeminiUltra。谷歌称，Gemini1.5 Pro 可以理解复杂的指令，并且无需对模型进行微调。

　　当然，Gemini1.5 Pro 目前仅限于 Vertex AI 用户体验，而 GeminiUltra 则因为Gemini聊天机器人的原因为所有 Pro 用户提供服务。不过，尽管 GeminiUltra 功能更多并且能够理解长指令，但处理速度不如 Gemini1.5 Pro。

　　实际上，Gemini1.5 Pro 并非唯一获得更新的谷歌大模型，辅助 Gemini生成图像的文生图模型 Imagen 2 也将加入修复和扩充功能，使用户可以添加或移除图像元素。

　　谷歌还为 Imagen 模型的所有提供了数字水印功能“SynthID”。简单来说，SynthID 在图像中添加了一个用户不可见的防伪标识，但可以通过检测工具来确认其值得注意的是，Imagen 的许多新功能，例如修复和扩充，已经出现在其他文生图模型中，例如 Stability AI 的 Stable Diffusion 和 Getty 公司的 Generative AI by iStock 上，更不用说最新款三星 Galaxy 手机还有类似的功能。

　　谷歌表示，他们还将在公开预览中尝试将 AI 响应与谷歌结果结合，以便利用最新情报进行解答。

　　参考资料：