|
|
2026年2月23日,美国AI公司Anthropic在其官方博客发布题为《Detecting and preventing distillation attacks》的报告,指出三家中国AI实验室——DeepSeek、Moonshot AI(Kimi)和MiniMax——涉嫌创建约2.4万个虚假账号,与Claude模型进行超过1600万次对话交互,用于提升自身模型能力。

这一披露将AI领域中“模型蒸馏”(distillation)技术的边界问题再次带入公众视野。 根据Anthropic报告披露的关键数据:
涉及虚假账号约 24,000 个
总对话交互次数超过 1,600 万次
操作方式包括使用代理服务、分布式“九头蛇集群”(Hydra cluster)分散流量,以规避检测和地区访问限制
交互呈现出系统性、结构化的特点,与普通用户使用模式存在明显差异
Anthropic表示,通过IP地址、请求元数据、基础设施特征及支付记录等线索,已将相关活动关联至上述三家实验室。
三家实验室的具体情况:
MiniMax
交互次数最多,超过1300万次(占总量的80%以上)。
重点提取方向为智能体开发、工具使用和复杂任务编排能力。部分活动在自家模型发布后仍持续进行。
Moonshot AI(Kimi)
交互次数约340万次。
主要针对智能体推理、计算机使用代理、计算机视觉以及数据分析等领域,部分交互涉及提取Claude的详细推理过程(reasoning traces)。
DeepSeek
交互次数约15万次,规模相对较小。
特点在于针对性较强,例如引导Claude输出完整思维链(Chain-of-Thought),或生成特定类型回答,用于强化学习和奖励模型训练。
(https://linux.do#p-14104043-anthropic-1)Anthropic的回应与担忧
Anthropic在报告中表示,此类行为不仅涉及商业条款问题,还可能带来更广泛的影响:
蒸馏后的模型可能缺少原模型的安全防护机制
先进能力可能被应用于未预期的场景
在当前技术出口管制环境下,存在绕过限制的情况
公司已加强检测系统、访问控制,并计划与行业伙伴共享情报,共同提升防御能力。 |
|