阿里正式发布Qwen3-235B-A22B-Thinking-2507

星*** · 发表于 2025-7-25 18:29:49

模型简介
我们隆重介绍 Qwen3-235B-A22B-Thinking-2507！这是 Qwen3-235B-A22B 的最新升级版，专为提升“推理能力”和处理高难度推理任务而打造。模型拥有2350亿总参数和220亿激活参数，原生支持256K（即262,144）tokens的超长上下文。

升级亮点
  逻辑推理、数学、科学和编码等任务上的性能显著提升，在开源推理模型中达到SOTA水平；
  通用能力也大幅增强，包括指令遵循、工具使用和文本生成等；
  模型的256K长上下文理解能力也得到了强化，我们强烈建议在高度复杂的推理任务中使用它；

测评结果
Qwen3-235B-A22B-Thinking-2507在多个权威基准测试中表现超群，模型在推理任务HMMT25、编码任务LiveCodeBench v6和CFEval、知识任务SuperGPQA以及多语言任务PolyMATH和MultiIF等多个测评中，均取得了当前对比中的最佳成绩。

模型文件
魔搭社区：通义千问3-235B-A22B-Thinking-2507 (http://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507)
HuggingFace：Qwen/Qwen3-235B-A22B-Thinking-2507 · Hugging Face (http://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507)
Github：GitHub - QwenLM/Qwen3: Qwen3 is the large language model series developed by Qwen team, Alibaba Cloud. (http://github.com/QwenLM/Qwen3)
#通义实验室 #通义 #大模型 #通义千问 #Qwen3 #Qwen3Thinking
从小红书转载

		自动登录	找回密码
密码			立即注册