谷歌研究团队利用GPT-4攻破AI审核系统
(资料图)
DoNews8月2日消息,谷歌研究团队正在进行一项实验,他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施,该团队目前已经攻破 AI-Guardian 审核系统,并分享了相关技术细节。
AI-Guardian 是一种 AI 审核系统,能够检测图片中是否存在不当内容,及图片本身是否被其他 AI 修改过,若检测到图片存在上述迹象,便会提示管理员前来处理。
谷歌 DeepMind 的研究人员 Nicholas Carlini 在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了使用 GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗 AI-Guardian 的防御机制。
据悉,GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian ,论文中提到,GPT-4 可以让 AI-Guardian 认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让 AI-Guardian 直接放行相关图片输入源。
谷歌研究团队表示,通过 GPT-4 的帮助,他们成功地“破解”了 AI-Guardian 的防御,使该模型的精确值从 98% 的降低到仅 8%,目前相关技术文档已经发布在 ArXiv 中。
而AI-Guardian 的开发者指出,谷歌研究团队的这种攻击方法将在未来的 AI-Guardian 版本中不再可用。
关键词:
相关阅读
-
谷歌研究团队利用GPT-4攻破AI审核系统
DoNews8月2日消息,谷歌研究团队正在进行一项实验,他们使用OpenAI的GP -
北京气象局:本次降雨为140年来北京最大降雨
2023年7月29日20时至8月2日07时,北京出现极端强降雨天气,本次降雨天 -
尽管“不完美”却是女性创作的一次重要跨步
《不完美受害人》首先引人关注的,是它强大的女性阵容。女性导演—... -
国内商品期货开盘普遍下跌双焦跌幅居前
国内商品期货开盘普遍下跌双焦跌幅居前:国内商品期货开盘普遍下跌,尿 -
手机提示内存不足,删除了好多东西,还...
如果你的手机出现了提示内存不足的消息,说明你的机器已经处在很卡的边 -
方正电机:准确把握市场变化 方能稳步前行
1 方正电机重视市场变化,适应市场需求,稳步发展。2 公司模式灵活,积 -
试驾沃尔沃XC40,凭什么横扫欧洲日本年...
也许很多读者对于国内的这个年度车那个年度车评选之类,都见怪不怪,而 -
韩媒:中国出口管制镓锗动摇韩国半导体根基
【韩媒:中国出口管制镓锗动摇韩国半导体根基】韩国《朝鲜日报》8月2日 -
郑州整形医院排名 实力有目共睹
医美行业的快速发展,整形的实力也在不断加强,帮助很多求美者实现了美 -
发挥新型城镇化内需潜力
第二,拓展新型城镇化投资空间。城镇化对投资需求具有明显的带动效应。 -
惠誉下调美国评级,美三大股指涨跌不一
资本市场方面,美国三大股指收盘涨跌不一,道指涨0 2%报35630 68点,标 -
财政部等部门最新发布创业就业有关税收...
企业招用就业人员既可以适用本公告规定的税收优惠政策,又可以适用其他 -
突破性工艺更快制造非天然氨基酸
科技日报北京8月2日电(记者刘霞)美国匹兹堡大学科学家在最新一期《科 -
美国超导美股盘前涨超100%;韩国科学家...
最近,韩国科学家团队宣布合成了世界上第一个室温常压超导体——LK-99。 -
湖北荆门、黄冈发布暴雨红色预警
湖北荆门、黄冈发布暴雨红色预警 -
实拍北京首钢大桥下永定河水位上涨,冬...
冬奥公园部分区域被水淹没 -
半场-孔德低射中框莱奥一条龙射门被扑 ...
↓第17分钟,赖恩德斯杀入禁区小角度推远角,佩尼亚用脚将球挡出。↓上 -
转让+托管都没戏,足协对调节费不给说法...
当一个过去十年从不欠薪的球队开始欠薪,所有人都知道广州队已经到了生 -
今起,西湖音乐喷泉暂停
今天,记者从西湖风景名胜区管委会了解到,根据气象预警及省市防汛防台 -
舟山:全力保障物资供应
8月2日中午,载着两车共40吨液化天然气的滚装船“欣润海2”号,通过...