星颖资源网

 找回密码
 立即注册
查看: 7|回复: 0

英国 AI 安全研究所 (AISI) 发布大模型安全评测工具 ControlArena

[复制链接]

2万

主题

1万

回帖

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
110880
发表于 2026-2-19 19:55:24 | 显示全部楼层 |阅读模式
大模型安全和评测这块,之前出的 Inspect 框架的英国 AI 安全研究所 (AISI) 。最近他们又开源了新工具 ControlArena
这玩意主要用来在受控的沙盒环境里,自动化评估大模型 Agent 的自主性边界和潜在危险能力。
官网:

Inspect (https://inspect.aisi.org.uk/)

Inspect (https://inspect.aisi.org.uk/)
Open-source framework for large language model evaluations
项目:
github.com (https://github.com/UKGovernmentBEIS/control-arena)

GitHub - UKGovernmentBEIS/control-arena: ControlArena is a collection of settings, model... (https://github.com/UKGovernmentBEIS/control-arena)
ControlArena is a collection of settings, model organisms and protocols - for running control experiments.
github.com (https://github.com/UKGovernmentBEIS/inspect_ai?tab=readme-ov-file)

GitHub - UKGovernmentBEIS/inspect_ai: Inspect: A framework for large language model... (https://github.com/UKGovernmentBEIS/inspect_ai?tab=readme-ov-file)
Inspect: A framework for large language model evaluations
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信

社群

VIP

AI

顶部

QQ|本站内容来源网友投稿或网络转载,如果有侵权的内容,请联系我们删除。|小黑屋|人人为我,我为人人!| 星颖资源网

GMT+8, 2026-6-8 04:35 , Processed in 0.041988 second(s), 26 queries .

快速回复 返回顶部 返回列表