星颖资源网

 找回密码
 立即注册
查看: 6|回复: 0

中转站搅局学术圈

[复制链接]

2万

主题

1万

回帖

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
110880
发表于 2026-3-7 21:41:36 | 显示全部楼层 |阅读模式
论文称近半数第三方中转API存在模型不一致问题
3月5日发布于arXiv的论文对17个被187篇论文使用的第三方中转API进行审计。这类API并非官方提供,而是由第三方转接官方大模型接口。研究通过性能测试和模型指纹识别核查其是否实际调用所标称模型 。
结果显示,在24个测试端点中,45.83%未通过模型身份验证。部分接口在医学和法律等测试中表现明显低于官方版本。例如在MedQA测试中,Gemini-2.5-flash官方准确率为83.82%,通过相关中转API调用后平均降至约36.95%。论文认为,这可能影响科研结果的可靠性
PS:看到这新闻,有点难绷,平时学者做对比用的如果是中转站,论文效果超越claude opus,实际可能路由到 gpt-oss
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信

社群

VIP

AI

顶部

QQ|本站内容来源网友投稿或网络转载,如果有侵权的内容,请联系我们删除。|小黑屋|人人为我,我为人人!| 星颖资源网

GMT+8, 2026-6-8 09:01 , Processed in 0.092114 second(s), 25 queries .

快速回复 返回顶部 返回列表