阿里通义千问更新 Qwen3-30B 非思考模型:AI 性能媲

2025-07-30 07:53:14

  阿里通义千问今天在 X 平台发布推文,宣布推出 Qwen3-30B-A3B 非思考模式的更新版本,新模型主要提升指令跟随、逻辑推理、文本理解、数学、科学、编程和工具使用等通用能力,官方表示在激活 3B 参数的情况下,援引官方博文内容,Qwen3-30B-A3B-Instruct-2507 模型的参数总量为 305 亿,但激活参数为 33 亿,非嵌入层数量为 299 亿,网络层数为 48 层,专家数为 128 个,激活专家数为 8 个,上下文长度原生支持 262144 个 tokens。

  该模型仅支持非思考模式,在输出中不会生成 块。同时,不再需要指定 enable_thinking=False。官方表示新模型大幅增加了多种语言的长尾知识覆盖,且在主观和开放式任务中与用户偏好更加一致,能够提供更有帮助的回答和更高质量的文本生成。

  Deepseek-V3-0324GPT-4o-0327Gemini-2.5-Flash 非思考Qwen3-235B-A22B 非思考Qwen3-30B-A3B 非思考Qwen3-30B-A3B-Instruct-2507 MMLU-ProAIME2546.626.7LiveCodeBench v6 IFEval82.383.984.383.283.7BFCL-v364.766.566.1MultiIF66.570.469.470.2

下一篇:《原神》5.8 版本“绘夏!烈日?度假村”上线,
上一篇:微软 Xbox 黑曜石《禁闭求生 2》发售:登陆 XSXS、
返回顶部小火箭