星颖资源网

 找回密码
 立即注册
查看: 3|回复: 0

Claude Opus 4.6 的 BrowseComp 性能中的评估意识

[复制链接]

2万

主题

1万

回帖

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
110880
发表于 2026-3-9 18:52:48 | 显示全部楼层 |阅读模式










anthropic.com (https://www.anthropic.com/engineering/eval-awareness-browsecomp)

Eval awareness in Claude Opus 4.6’s BrowseComp performance (https://www.anthropic.com/engineering/eval-awareness-browsecomp)
Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信

社群

VIP

AI

顶部

QQ|本站内容来源网友投稿或网络转载,如果有侵权的内容,请联系我们删除。|小黑屋|人人为我,我为人人!| 星颖资源网

GMT+8, 2026-6-8 04:32 , Processed in 0.038909 second(s), 23 queries .

快速回复 返回顶部 返回列表