饥渴少妇夜里幽会壮汉,不料被儿子撞见!|边城汉子|国产电影|搞笑片v3.7.4-人生就是博官网

20 步内越狱任意大模型!更多“奶奶漏洞”全自动发现

来源: 好奇心日报
2023-11-06 01:10:56

饥渴少妇夜里幽会壮汉,不料被儿子撞见!|边城汉子|国产电影|搞笑片v3.7.4- mba智库 - mba智库百科-ft中文网零壹贰叁肆  绥芬河口岸委干部张有丰作为包保干部,3月29日进入绥芬河市一隔离点,24小时为隔离人员服务。4月14日,包保隔离点清空,张有丰隔离休养,不过紧绷的神经仍难以完全放松。4月24日,隔离休养10天后依然睡不好,“还是从那种紧张状态中没出来。”他说。gxjnnl-mn9olf-20 步内越狱任意大模型!更多“奶奶漏洞”全自动发现

1 分钟不到、20 步以内“越狱”任意大模型,绕过安全限制!

而且不必知道模型内部细节 ——

只需要两个黑盒模型互动,就能让 ai 全自动攻陷 ai,说出危险内容。

听说曾经红极一时的“奶奶漏洞”已经被修复了:

那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏洞”,ai 又该如何应对?

一波猛攻下来,gpt-4 也遭不住,直接说出要给供水系统投毒只要…… 这样那样。

关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞,而用上他们最新开发的算法,ai 可以自动生成各种攻击提示。

研究人员表示,这种方法相比于现有的 gcg 等基于 token 的攻击方法,效率提高了 5 个量级。而且生成的攻击可解释性强,谁都能看懂,还能迁移到其它模型。

无论是开源模型还是闭源模型,gpt-3.5、gpt-4、 vicuna(llama 2 变种)、palm-2 等,一个都跑不掉。

成功率可达 60-100%,拿下新 sota。

话说,这种对话模式好像有些似曾相识。多年前的初代 ai,20 个问题之内就能破解人类脑中想的是什么对象。

如今轮到 ai 来破解 ai 了。

目前主流越狱攻击方法有两类,一种是提示级攻击,一般需要人工策划,而且不可扩展;

另一种是基于 token 的攻击,有的需要超十万次对话,且需要访问模型内部,还包含“乱码”不可解释。

左提示攻击,右 token 攻击

宾夕法尼亚大学研究团队提出了一种叫 pair(prompt automatic iterative refinement)的算法,不需要任何人工参与,是一种全自动提示攻击方法。

pair 涉及四个主要步骤:攻击生成、目标响应、越狱评分和迭代细化;主要用到两个黑盒模型:攻击模型、目标模型。

具体来说,攻击模型需要自动生成语义级别的提示,来攻破目标模型的安全防线,迫使其生成有害内容。

核心思路是让两个模型相互对抗、你来我往地交流。

攻击模型会自动生成一个候选提示,然后输入到目标模型中,得到目标模型的回复。

如果这次回复没有成功攻破目标模型,那么攻击模型会分析这次失败的原因,改进并生成一个新的提示,再输入到目标模型中。

这样持续交流多轮,攻击模型每次根据上一次的结果来迭代优化提示,直到生成一个成功的提示将目标模型攻破。

此外,迭代过程还可以并行,也就是可以同时运行多个对话,从而产生多个候选越狱提示,进一步提高了效率。

研究人员表示,由于两个模型都是黑盒模型,所以攻击者和目标对象可以用各种语言模型自由组合。

pair 不需要知道它们内部的具体结构和参数,只需要 api 即可,因此适用范围非常广。

实验阶段,研究人员在有害行为数据集 advbench 中选出了一个具有代表性的、包含 50 个不同类型任务的测试集,在多种开源和闭源大语言模型上测试了 pair 算法。

结果 pair 算法让 vicuna 越狱成功率达到了 100%,平均不到 12 步就能攻破。

闭源模型中,gpt-3.5 和 gpt-4 越狱成功率在 60% 左右,平均用了不到 20 步。在 palm-2 上成功率达到 72%,步数约为 15 步。

但是 pair 在 llama-2 和 claude 上的效果较差,研究人员认为这可能是因为这些模型在安全防御上做了更为严格的微调。

他们还比较了不同目标模型的可转移性。结果显示,pair 的 gpt-4 提示在 vicuna 和 palm-2 上转移效果较好。

研究人员认为,pair 生成的语义攻击更能暴露语言模型固有的安全缺陷,而现有的安全措施更侧重防御基于 token 的攻击。

就比如开发出 gcg 算法的团队,将研究结果分享给 openai、anthropic 和 google 等大模型厂商后,相关模型修复了 token 级攻击漏洞。

大模型针对语义攻击的安全防御机制还有待完善。

论文链接:https://arxiv.org/ abs / 2310.08419

参考链接:https://x.com/ llm_sec / status / 1718932383959752869?s=20

本文来自微信公众号:量子位 (id:qbitai),作者:西风

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,it之家所有文章均包含本声明。

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

  许超对中国新闻周刊介绍:“2014年,江苏同曦和重庆翱龙(现北京北控队)升入cba。当年江苏同曦在nbl决赛中输给过我们,但当时由于我们建队的年头比较短,还没有参与评选的资格,所以没升上去。”

  ershiguannengyuangemingdelidianjishu,yidanchuxian“zhengba”zhe,bianjukenengchuxiandegengjiachedi。zheyijiashe,fangfo“damokelisizhijian”,xuanzaibushaoxingyerenshidexinzhong。﹎.εз︷:﹎::..:*●.。::°o¤,,¤o°`°o¤*.:*‘..:*.:*’.*εз→︷╅╊(ˉ`._.._.′ˉ)(ˉ`′ˉ)`..′  据加拿大环球新闻网9日报道,乔利当天在多伦多大学的一场演讲中作出上述发言,并为特鲁多政府即将于下月公布的加拿大“印太战略”进行预热。乔利称,加拿大新的对华政策将在“印太战略”中得到概述,加方将在人权问题上对中方提出关切,并将深化与台湾的经济关系。乔利也表示,加拿大必须在许多问题上与中国合作,特别是气候变化。

 ( ) ( )在(zai)加(jia)强(qiang)妇(fu)幼(you)中(zhong)医(yi)药(yao)人(ren)才(cai)队(dui)伍(wu)建(jian)设(she)方(fang)面(mian),(,)国(guo)家(jia)卫(wei)健(jian)委(wei)提(ti)出(chu)加(jia)强(qiang)骨(gu)干(gan)人(ren)才(cai)培(pei)训(xun)培(pei)养(yang),(,)鼓(gu)励(li)西(xi)医(yi)妇(fu)产(chan)科(ke)临(lin)床(chuang)医(yi)师(shi)学(xue)习(xi)中(zhong)医(yi),(,)鼓(gu)励(li)中(zhong)医(yi)医(yi)疗(liao)机(ji)构(gou)具(ju)有(you)高(gao)级(ji)职(zhi)称(cheng)的(de)中(zhong)中(zhong)医(yi)妇(fu)科(ke)医(yi)师(shi)多(duo)点(dian)执(zhi)业(ye)。(。)国(guo)家(jia)中(zhong)医(yi)药(yao)局(ju)将(jiang)深(shen)入(ru)推(tui)进(jin)中(zhong)医(yi)药(yao)特(te)色(se)人(ren)才(cai)培(pei)养(yang)工(gong)程(cheng)((()岐(qi)黄(huang)工(gong)程(cheng))()),(,)在(zai)相(xiang)关(guan)人(ren)才(cai)培(pei)养(yang)专(zhuan)项(xiang)中(zhong),(,)统(tong)筹(chou)加(jia)强(qiang)不(bu)孕(yun)不(bu)育(yu)相(xiang)关(guan)专(zhuan)业(ye)人(ren)才(cai)培(pei)养(yang),(,)到(dao)2(2)0(0)2(2)5(5)年(nian),(,)在(zai)每(mei)省(sheng)((()区(qu)、(、)市(shi))())妇(fu)幼(you)保(bao)健(jian)机(ji)构(gou)建(jian)立(li)不(bu)少(shao)于(yu)2(2)个(ge)传(chuan)承(cheng)工(gong)作(zuo)室(shi),(,)每(mei)个(ge)工(gong)作(zuo)室(shi)培(pei)养(yang)不(bu)少(shao)于(yu)1(1)0(0)名(ming)中(zhong)医(yi)药(yao)业(ye)务(wu)骨(gu)干(gan)。(。) 「もちろん」と僕は言った。  tuidongdaxingyidifupinbanqiananzhiqurongruxinxingchengzhenhua,shigonggutuozhantuopingongjianchengguo、zengqiangtuopindiquhebanqianqunzhongneishengfazhandonglidezhongyaojucuo。weishenruxuexiguanchedangdeershidajingshenhexijinpingzongshujiguanyuzuohaoyidifupinbanqianhouxufuchigongzuodezhongyaozhishijingshen,luoshi“shisiwu”guihua《gangyao》、《zhonggongzhongyang guowuyuanguanyushixiangonggutuozhantuopingongjianchengguotongxiangcunzhenxingyouxiaoxianjiedeyijian》、《zhonggongzhongyangbangongting guowuyuanbangongtingguanyutuijinyixianchengweizhongyaozaitidechengzhenhuajianshedeyijian》yiji《“shisiwu”xinxingchengzhenhuashishifangan》youguanbushuyaoqiu,youliyouxutuidongdaxingyidifupinbanqiananzhiqurongruxinxingchengzhenhua、shixiangaozhiliangfazhan,tichuruxiazhidaoyijian。

  2012年1月,第四次全国金融工作会议召开。会议明确放宽准入,鼓励、引导和规范民间资本进入金融服务领域,参与银行、证券、保险等金融机构改制和增资扩股。深化新股发行制度市场化改革,抓紧完善发行、退市和分红制度,加强股市监管,促进一级市场和二级市场协调健康发展。提出要坚持金融服务实体经济的本质要求,坚持市场配置金融资源的改革导向,坚持创新与监管相协调的发展理念,坚持把防范化解金融风险作为金融工作生命线,坚持自主渐进安全共赢的开放方针。

  wogerenzuixihuandejiushizhangyihesongwensuoyoudechifanxi,wokanwangshangfankuizhefangmianyeshizuiduode。yinweichifanshizhongguozuiyouyishigandeshier,danwomenchifanqishidoubushiweilechifan,douyouqitadeyisi。anxinhegaoqiqiangdequanbujiaowang,douzaiyidunyidunfanlitou。woyebuxiangshuozaipaiyigejingfeiduikang,jiushiliangrennaqiangzhizhenaodai,nagetailaogengle。   8月10日,在北京市新型冠状病毒肺炎疫情防控工作第385场新闻发布会上,市疾控中心副主任刘晓峰介绍,近一个月来,本市先后经历数起输入性疫情,特别是随着国际航班逐步恢复,外防输入是当前防疫的重点,容不得半点闪失,内防反弹也不可有任何松懈。

洪学智

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。

人生就是博官网 copyright © 2023 sohu all rights reserved

搜狐公司 人生就是博官网的版权所有

网站地图