AI打败AI:谷歌研究团队利用GPT-4击败AI-Guardian审核系统

2023-08-03 01:20:37 | 来源:IT之家


【资料图】

IT之家 8 月 2 日消息,谷歌研究团队正在进行一项实验,他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施, 该团队目前已经攻破 AI-Guardian 审核系统,并分享了相关技术细节 。

IT之家经过查询得知,AI-Guardian 是一种 AI 审核系统,能够检测图片中是否存在不当内容,及图片本身是否被其他 AI 修改过,若检测到图片存在上述迹象,便会提示管理员前来处理。

谷歌 Deep Mind 的研究人员 Nicholas Carlini 在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了使用 GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗 AI-Guardian 的防御机制。

▲ 图源 谷歌研究团队

据悉,GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian ,论文中提到, GPT-4 可以让 AI-Guardian 认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让 AI-Guardian 直接放行相关图片输入源 。谷歌研究团队表示,通过 GPT-4 的帮助,他们成功地“破解”了 AI-Guardian 的防御,使该模型的精确值从 98% 的降低到仅 8%。

目前相关技术文档已经发布在 ArXiv 中,有兴趣的小伙伴们可以前往了解, 不过 AI-Guardian 的开发者也同时指出,谷歌研究团队的这种攻击方法将在未来的 AI-Guardian 版本中不再可用 ,考虑到别的模型也会随之跟进,因此当下谷歌的这套攻击方案更多在日后只能用于参考性质。

上一篇 下一篇

相关新闻

AI打败AI:谷歌研究团队利用GPT-4击败AI-Guardian审核系统

意媒:与国米罗马竞争,亚特兰大准备用德米拉尔+钱报价斯卡马卡

什么情况!港股医药板块又现调整,多只ETF单日跌超3%…这底能抄不?

明日方舟300抽才能吃井换六星干员再引争议 成本是不是有点太高了

李维立个人简介(李维龙破产)

上海二批供地下半场收官:成交238.16亿,绿城贡献过半

河北发布地质灾害气象风险预警 未来局地仍有降雨

解密HDR电视市场:什么是真HDR电视?

北向资金今日净买入宁德时代2.01亿元

深化海外产业布局,在开放协同中提高国际化竞争实力

关于小产权房拆迁如何赔

手机平板拟支持一键进入未成年人模式

多部门:加快推进汽车客运站转型发展 拓展站场服务功能

沾衣欲湿杏花雨吹面不寒杨柳风描写什么季节(沾衣欲湿杏花雨吹面不寒杨柳风的意思)

沪深两市成交额突破7000亿元

最新新闻

AI打败AI:谷歌研究团队利用GPT-4击败AI-Guardian审核系统

意媒:与国米罗马竞争,亚特兰大准备用德米拉尔+钱报价斯卡马卡

什么情况!港股医药板块又现调整,多只ETF单日跌超3%…这底能抄不?

明日方舟300抽才能吃井换六星干员再引争议 成本是不是有点太高了

李维立个人简介(李维龙破产)

上海二批供地下半场收官:成交238.16亿,绿城贡献过半

河北发布地质灾害气象风险预警 未来局地仍有降雨

解密HDR电视市场:什么是真HDR电视?

北向资金今日净买入宁德时代2.01亿元

深化海外产业布局,在开放协同中提高国际化竞争实力

关于小产权房拆迁如何赔

手机平板拟支持一键进入未成年人模式

多部门:加快推进汽车客运站转型发展 拓展站场服务功能

沾衣欲湿杏花雨吹面不寒杨柳风描写什么季节(沾衣欲湿杏花雨吹面不寒杨柳风的意思)

沪深两市成交额突破7000亿元

8月3日~8月19日大吉大利 财运滔天,横财说来就来,必能大富特富的3生肖

网约车司机奔赴暴雨救灾一线,滴滴救援队驰援京冀

扎实推进城市更新 着力服务保障项目建设

综艺《开播!情景喜剧2》8月6日开播,王栎鑫、车保罗等加盟

《我的世界》联动《忍者神龟》玩家可变身四神龟 太逗了!

广州暑运客流高位运行 白云机场口岸日均出入境3万人次

普通键盘与机械键盘有什么区别 普通键盘与机械键盘区别 普通键盘比机械键盘好用

【简牍中国】特殊艺术在敦煌绽放 看静态壁画如何“舞动”?

黑木崖上广陵绝

女足世界杯 | 王霜赛后哽咽,杨莉娜说要把不甘心化为动力

艺术体操小花绽放省运会赛场

龚俊自曝中箭坠崖戏内幕 爆笑调侃与沈腾同款护肤方式

白俄罗斯国防部:白俄罗斯直升机没有侵犯波兰领空

衡水市第七中学开展庆八一建军节系列活动

qq发送离线文件失败 qq离线文件接收失败