阿里通义千问开源 Qwen2-VL-2B 7B-Instruct 模型
通义千问团队今天对 Qwen-VL 模型进行更新,推出 Qwen2-VL。
Qwen2-VL 的一项关键架构改进是实现了另一个关键架构增强是 Multimodal Rotary Position Embedding。通过将 original rotary embedding 分解为代表时间和空间信息的三个部分,M-ROPE 使 LLM 能够在 7B 规模下,Qwen2-VL-7B 保留了Qwen2-VL-2B 模型附模型链接如下:
Qwen2-VL-2B-Instruct:
Qwen2-VL-7B-Instruct:
