星颖资源网

 找回密码
 立即注册
查看: 7|回复: 0

Qwen在B站发布动态,声称”千问3.7编程仅次于Claude“

[复制链接]

2万

主题

1万

回帖

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
110880
发表于 2026-5-26 12:25:42 | 显示全部楼层 |阅读模式
动态:
刚刚,全球权威编程榜单 Code Arena正式放榜,千问最新旗舰模型 Qwen3.7-Max得分 1541,超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一众模型,仅次于Claude系列,在大模型厂商中排名全球第二。

全球权威编程榜单 Code Arena
这是由知名第三方大模型盲测平台 LMArena 推出的最具影响力的编程能力榜单之一。与传统的代码基准测试不同,Code Arena 由开发者出题,要求模型从零生成完整的、可交互的 Web 应用程序,并交由用户对匿名模型进行两两 PK 盲测投票,根据投票综合生成最终榜单。因此,Code Arena 也被视为目前 全球最具公信力的 AI 编程能力评测 之一。

编程突出的 Qwen3.7-Max
Qwen3.7-Max 在 Code Arena 榜单中斩获 1541 分,次于最强模型Claude-opus-4.7,可媲美Claude-opus-4.6,是目前榜单中唯一突破 1540 分大关的国产大模型。
在真实项目交付能力上,Qwen3.7-Max 同样表现出色:能在数小时内独立完成专业团队耗时 2 周的复杂项目端到端交付;可持续运行 35 小时,累计完成超 1000 次工具调用的复杂长程任务,甚至能自我编程优化芯片内核。
感谢全球开发者的每一次投票和反馈,我们将继续努力,打磨更好的模型给大家。
链接: 千问大模型的动态 - 哔哩哔哩 (https://www.bilibili.com/opus/1206588495417573380)

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信

社群

VIP

AI

顶部

QQ|本站内容来源网友投稿或网络转载,如果有侵权的内容,请联系我们删除。|小黑屋|人人为我,我为人人!| 星颖资源网

GMT+8, 2026-6-8 05:49 , Processed in 0.166450 second(s), 31 queries .

快速回复 返回顶部 返回列表