星颖资源网

 找回密码
 立即注册
查看: 6|回复: 0

阿里通义千问 Qwen3 系列模型有望今日发布,支持 256K 上下文长度

[复制链接]

2万

主题

1万

回帖

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
110880
发表于 2025-4-28 21:19:39 | 显示全部楼层 |阅读模式
值得一提的是,Qwen3 系列模型合集已在阿里巴巴旗下 AI 模型开源社区 ModelScope(魔搭)短暂亮相后又下线,包括 Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B 及 Qwen3-30B-A3B-Base 四款模型。所有模型均采用 Apache License 2.0 开源协议。尽管官方尚未发布正式公告,但结合命名规则与前代技术逻辑,可推测其技术路径与定位方向。
此次发布的模型中,Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B 以参数规模直接命名,分别对应 40 亿、17 亿和 6 亿参数。此类无后缀的命名方式或表明其为单架构稠密模型,未采用混合专家(MoE)设计,推测主打轻量化应用场景。而 Qwen3-30B-A3B-Base 为 MoE 架构基础模型,总参数 300 亿(30B)中动态调用 30 亿(3B)参数处理任务。 阿里通义千问 Qwen3 系列模型有望今日发布,支持 256K 上下文长度 - IT之家 (https://www.ithome.com/0/849/631.htm)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信

社群

VIP

AI

顶部

QQ|本站内容来源网友投稿或网络转载,如果有侵权的内容,请联系我们删除。|小黑屋|人人为我,我为人人!| 星颖资源网

GMT+8, 2026-6-8 03:23 , Processed in 0.079530 second(s), 28 queries .

快速回复 返回顶部 返回列表