阿里通义千问开源 Qwen2-VL-2B 7B-Instruct 模型

2024-08-30 10:10:49

  通义千问团队今天对 Qwen-VL 模型进行更新,推出 Qwen2-VL。

  Qwen2-VL 的一项关键架构改进是实现了另一个关键架构增强是 Multimodal Rotary Position Embedding。通过将 original rotary embedding 分解为代表时间和空间信息的三个部分,M-ROPE 使 LLM 能够在 7B 规模下,Qwen2-VL-7B 保留了Qwen2-VL-2B 模型附模型链接如下:

  Qwen2-VL-2B-Instruct:

  Qwen2-VL-7B-Instruct:

下一篇:腾讯、被曝拟缩减在日本游戏投资,双方回应
上一篇:AI 行业风光背后:80% 项目会失败,5 大原因导致
返回顶部小火箭