模型简介
我们隆重介绍 Qwen3-235B-A22B-Thinking-2507!这是 Qwen3-235B-A22B 的最新升级版,专为提升“推理能力”和处理高难度推理任务而打造。模型拥有2350亿总参数和220亿激活参数 ,原生支持256K(即262,144)tokens的超长上下文。
升级亮点
逻辑推理、数学、科学和编码等任务上的性能显著提升,在开源推理模型中达到SOTA水平;
通用能力也大幅增强,包括指令遵循、工具使用和文本生成等;
模型的256K长上下文理解能力也得到了强化,我们强烈建议在高度复杂的推理任务中使用它;
测评结果
Qwen3-235B-A22B-Thinking-2507在多个权威基准测试中表现超群,模型在推理任务HMMT25、编码任务LiveCodeBench v6和CFEval、知识任务SuperGPQA以及多语言任务PolyMATH和MultiIF等多个测评中,均取得了当前对比中的最佳成绩。
模型文件
魔搭社区:通义千问3-235B-A22B-Thinking-2507 (http://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507)
HuggingFace:Qwen/Qwen3-235B-A22B-Thinking-2507 · Hugging Face (http://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507)
Github:GitHub - QwenLM/Qwen3: Qwen3 is the large language model series developed by Qwen team, Alibaba Cloud. (http://github.com/QwenLM/Qwen3)
#通义实验室 #通义 #大模型 #通义千问 #Qwen3 #Qwen3Thinking
从小红书转载