阿里通义千问开源 Qwen2-VL-2B 7B-Instruct 模型

2024-08-30 10:10:49

　　通义千问团队今天对 Qwen-VL 模型进行更新，推出 Qwen2-VL。

　　Qwen2-VL 的一项关键架构改进是实现了另一个关键架构增强是 Multimodal Rotary Position Embedding。通过将 original rotary embedding 分解为代表时间和空间信息的三个部分，M-ROPE 使 LLM 能够在 7B 规模下，Qwen2-VL-7B 保留了Qwen2-VL-2B 模型附模型链接如下：

　　Qwen2-VL-2B-Instruct：

　　Qwen2-VL-7B-Instruct：