星颖资源网

 找回密码
 立即注册
查看: 7|回复: 0

疑似有人猜出了Mythos(风味?)架构并开源

[复制链接]

2万

主题

1万

回帖

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
110880
发表于 2026-4-20 15:57:47 | 显示全部楼层 |阅读模式
https://x.com/KyeGomezB/status/2045659150340723107
github.com (https://github.com/kyegomez/OpenMythos)

GitHub - kyegomez/OpenMythos: A theoretical reconstruction of the Claude Mythos... (https://github.com/kyegomez/OpenMythos)
A theoretical reconstruction of the Claude Mythos architecture, built from first principles using the available research literature.
目前GitHub上已经2k star了,具体细节在X上有说明。作者也强调了属于理论探讨,仅供参考(不过还是起了OpenMythos的名字)。
按我浅显的理解,传统思路是堆层数,参数爆炸,作者考虑可以把一些层重复使用,最多能循环16次。然后结合MoE的方案,每次循环激活的专家不一样,那就避免了简单重复每次循环到一样的东西。(但是这样实际训练算力并没有节省多少吧,比如1T的参数多循环几次肯定算力也要翻几倍了,可能也就是部署推理的时候省点显存?)
刚好隔壁看到有佬说Opus 4.6是5T参数,4.7就阉割到只有1T,我怀疑是不是就用这个思路,1T的参数量循环10次甚至9次,发现有些性能指标比5T的强,就放出来作为4.7
然后他们那个吹上天的Mythos说不定就是拿5T参数的模型循环10次甚至9次,一看都赶上10T甚至9T参数量了,所以拿出来大吹特吹?不过Mythos要是真的那么强,怎么不先用来升级下4.7,最糟糕的情况下,该不会Mythos全是营销,实际就是4.7吧?
后面放一些X上的截图,不过这个看到没绷住必须放前面,哎,Deepseek怎么那么坏





回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信

社群

VIP

AI

顶部

QQ|本站内容来源网友投稿或网络转载,如果有侵权的内容,请联系我们删除。|小黑屋|人人为我,我为人人!| 星颖资源网

GMT+8, 2026-6-8 09:00 , Processed in 0.039745 second(s), 22 queries .

快速回复 返回顶部 返回列表