星颖资源网

 找回密码
 立即注册
查看: 7|回复: 0

“冷门事实记忆”反推闭源大模型参数量, 估算 GPT-5.5 约 9T、Claude Opus 4.7 约 4T

[复制链接]

2万

主题

1万

回帖

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
110880
发表于 2026-4-30 11:18:43 | 显示全部楼层 |阅读模式
很有意思的研究~
https://arxiv.org/pdf/2604.24827



原贴内容
闭源实验室都对模型规模讳莫如深,但他们其实藏不住模型"知道什么"。而模型知道什么,恰恰就是参数量的指标。
核心逻辑:推理能力可以靠蒸馏压缩到小模型里,事实知识不行。一个模型记得多少冷门事实,直接跟它的参数量挂钩。
知乎博主李博杰为这个写了一篇小论文,构建了一套叫 IKP(不可压缩知识探针)的数据集:1400 个问题、7 层稀有度,扔到 27 家厂商的 188 个模型上跑了一遍,只看事实准确率。
结果在 89 个公开参数的开源模型上,准确率 vs log(参数量) 的拟合 R=0.917,基本是一条直线。把闭源模型投影上去,规模就估出来了:
GPT-5.5 ≈ 9T
Claude Opus 4.7 ≈ 4T
GPT-5.4 ≈ 2.2T
Claude Sonnet 4.6 ≈ 1.7T
Gemini 2.5 Pro ≈ 1.2T
(90% 置信区间:0.3-3 倍规模)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信

社群

VIP

AI

顶部

QQ|本站内容来源网友投稿或网络转载,如果有侵权的内容,请联系我们删除。|小黑屋|人人为我,我为人人!| 星颖资源网

GMT+8, 2026-6-8 12:09 , Processed in 0.122456 second(s), 66 queries .

快速回复 返回顶部 返回列表