阿里 QwQ-32B 大模型集成至国家超算互联网平台
QwQ-32B 是阿里 Qwen 团队发布的推理模型,基于 Qwen2.5-32B + 强化学习构建。据官方公示的基准评测结果,在测试数学能力的 AIME24 评测集上,以及评估代码能力的 LiveCodeBench 中,QwQ-32B 表现与 DeepSeek-R1 相当,胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。
QwQ-32B 是阿里 Qwen 团队发布的推理模型,基于 Qwen2.5-32B + 强化学习构建。据官方公示的基准评测结果,在测试数学能力的 AIME24 评测集上,以及评估代码能力的 LiveCodeBench 中,QwQ-32B 表现与 DeepSeek-R1 相当,胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。