Qwen在B站发布动态,声称”千问3.7编程仅次于Claude“
动态:刚刚,全球权威编程榜单 Code Arena正式放榜,千问最新旗舰模型 Qwen3.7-Max得分 1541,超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一众模型,仅次于Claude系列,在大模型厂商中排名全球第二。
https://cdn.ldstatic.com/images/emoji/twemoji/boxing_glove.png?v=15
全球权威编程榜单 Code Arena
这是由知名第三方大模型盲测平台 LMArena 推出的最具影响力的编程能力榜单之一。与传统的代码基准测试不同,Code Arena 由开发者出题,要求模型从零生成完整的、可交互的 Web 应用程序,并交由用户对匿名模型进行两两 PK 盲测投票,根据投票综合生成最终榜单。因此,Code Arena 也被视为目前 全球最具公信力的 AI 编程能力评测 之一。
https://cdn.ldstatic.com/images/emoji/twemoji/glowing_star.png?v=15
编程突出的 Qwen3.7-Max
Qwen3.7-Max 在 Code Arena 榜单中斩获 1541 分,次于最强模型Claude-opus-4.7,可媲美Claude-opus-4.6,是目前榜单中唯一突破 1540 分大关的国产大模型。
在真实项目交付能力上,Qwen3.7-Max 同样表现出色:能在数小时内独立完成专业团队耗时 2 周的复杂项目端到端交付;可持续运行 35 小时,累计完成超 1000 次工具调用的复杂长程任务,甚至能自我编程优化芯片内核。
感谢全球开发者的每一次投票和反馈,我们将继续努力,打磨更好的模型给大家。
链接: 千问大模型的动态 - 哔哩哔哩 (https://www.bilibili.com/opus/1206588495417573380)
https://cdn3.ldstatic.com/original/4X/f/3/0/f30f119e1ea50f48ede3392e443fde7374a5fc25.png
https://cdn3.ldstatic.com/original/4X/c/3/0/c30c9e2e9752782f26154f3dd16c8f2d9772be47.png 这种帖子对我这种小白很友好,先学起来。 我们缺的根本不是资源,是心中的成见,是 自我矮化的认知 ! 有没有人需要交流一下看看能否有没有更好的点子 正能量到处传播~人生没有彩排,每天都是现场直播,所以不要总是想着"如果",因为没有"如果"
页:
[1]