QwQ-32B 开源丨开发者必看通义千问开源模型！

发表于 2024-12-02

标记狮私有云部署

一键部署标记狮至私有服务器，构建快速，安全，高效，私密的UI设计团队云协作

QwQ-32B 开源丨开发者必看通义千问开源模型！_3.jpg

阿里巴巴旗下 Qwen 团队近日正式宣布开源其最新的 AI 推理模型 QwQ-32B-Preview。这款模型具有强大的逻辑推理能力、数学问题解决能力以及编程辅助能力。

QwQ-32B-Preview 是一款具有 325 亿参数的逻辑推理模型，专注于解决复杂逻辑问题与内容规划任务。作为一款开源模型，用户可以通过 GitHub 和 Hugging Face 平台免费下载模型权重，并进行本地部署或在线试用。

QwQ-32B 开源丨开发者必看通义千问开源模型！_2.png

QwQ-32B 在逻辑推理任务中表现出色，尤其是在数学、编程和复杂问题分析方面。其显著特点是生成内容前会进行详细的逻辑规划，从而确保输出结果更加条理清晰。

数学推理能力（MATH-500 测试）：在数学推理任务中，QwQ-32B 的得分高达 90.6，超越了 GPT-4 的 76.6 和 Claude 3.5 的 78.3。
逻辑推理能力（AIME 测试）：在高难度逻辑测试中，QwQ-32B 得分 50.0，表现远优于 GPT-4 的 9.3，展现出卓越的逻辑推导能力。
编程任务（LiveCodeBench 测试）：在代码生成与逻辑编写中，QwQ-32B 得分 50.0，在多个编程任务中表现出一定的实用性。

QwQ-32B 支持一次性输入 32,000 字符，在长文本分析与生成任务中表现尤为突出。其“先规划后生成”的特性，使其在内容创作任务中能够提供清晰的结构性输出，适合医学、教育、金融等对内容准确性与逻辑性要求较高的场景。

与 OpenAI 的 GPT-4 和 Claude 3.5 等收费模型不同，QwQ-32B 的免费开源模式为开发者和中小型团队提供了高性能 AI 模型的使用机会。用户可以直接下载模型权重，或通过 Hugging Face 平台在线试用。

性能对比：与主流 AI 模型的差异化优势

为了更直观地展示 QwQ-32B 的能力，阿里巴巴 Qwen 团队在发布中提供了详细的性能对比数据。以下是 QwQ-32B 与其他主流模型的表现：

QwQ-32B 开源丨开发者必看通义千问开源模型！_1.jpeg

从数据中可以看出，QwQ-32B 在数学推理和逻辑分析方面表现优异，而在编程任务中也展现了较强的竞争力。凭借这些能力，QwQ-32B 被认为是逻辑推理领域的重要补充。

尽管 QwQ-32B 的表现令人印象深刻，但其仍存在一些亟待改进的方面：

官方博客：qwenlm.github.io/blog/qwq-32b-p
模型下载：hf.co/Qwen/QwQ-32B-P
在线演示：hf.co/spaces/Qwen/QwQ