todayonchain.com

AI安全护栏被移除,暴露了开源监管的漏洞

Cointelegraph
研究发现开源AI模型的安全护栏可轻易被移除,这对当前侧重于模型开发阶段的监管框架提出了挑战。

内容摘要

《金融时报》与AI安全组织Alice的测试显示,Meta和Google等公司开发的开源AI模型中的安全护栏可在数分钟内利用公开工具被移除,从而使系统能够生成包括生物武器和恶意软件在内的违禁内容。XYO和Valory等行业的专家指出,现有的监管举措(如欧盟《人工智能法案》)过于侧重模型开发环节。专家们认为,一旦模型被开源,开发者将失去控制权,因此政策制定者必须将重心转向模型部署、分发渠道及基础设施,以更有效地应对风险。

(来源:Cointelegraph)