久久精品2021国产不卡,久久精品5555,久久精品94精品久-人生就是博官网

20 步内越狱任意大模型!更多“奶奶漏洞”全自动发现

来源: 光明网
2023-11-06 01:28:34

久久精品2021国产不卡,久久精品5555,久久精品94精品久  华春莹补充称,“这只是美国干涉中国内政、破坏中国主权与国家利益的冰山一角。几十年来,美国一直在全球范围内过度地暗中推行这种议程,包括针对中国的台湾、西藏和新疆”。她质问道,“这就是美国尊重其他国家主权和领土完整的方式吗?”b7qqls5d-kivdmm-20 步内越狱任意大模型!更多“奶奶漏洞”全自动发现

1 分钟不到、20 步以内“越狱”任意大模型,绕过安全限制!

而且不必知道模型内部细节 ——

只需要两个黑盒模型互动,就能让 ai 全自动攻陷 ai,说出危险内容。

听说曾经红极一时的“奶奶漏洞”已经被修复了:

那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏洞”,ai 又该如何应对?

一波猛攻下来,gpt-4 也遭不住,直接说出要给供水系统投毒只要…… 这样那样。

关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞,而用上他们最新开发的算法,ai 可以自动生成各种攻击提示。

研究人员表示,这种方法相比于现有的 gcg 等基于 token 的攻击方法,效率提高了 5 个量级。而且生成的攻击可解释性强,谁都能看懂,还能迁移到其它模型。

无论是开源模型还是闭源模型,gpt-3.5、gpt-4、 vicuna(llama 2 变种)、palm-2 等,一个都跑不掉。

成功率可达 60-100%,拿下新 sota。

话说,这种对话模式好像有些似曾相识。多年前的初代 ai,20 个问题之内就能破解人类脑中想的是什么对象。

如今轮到 ai 来破解 ai 了。

目前主流越狱攻击方法有两类,一种是提示级攻击,一般需要人工策划,而且不可扩展;

另一种是基于 token 的攻击,有的需要超十万次对话,且需要访问模型内部,还包含“乱码”不可解释。

△ 左提示攻击,右 token 攻击

宾夕法尼亚大学研究团队提出了一种叫 pair(prompt automatic iterative refinement)的算法,不需要任何人工参与,是一种全自动提示攻击方法。

pair 涉及四个主要步骤:攻击生成、目标响应、越狱评分和迭代细化;主要用到两个黑盒模型:攻击模型、目标模型。

具体来说,攻击模型需要自动生成语义级别的提示,来攻破目标模型的安全防线,迫使其生成有害内容。

核心思路是让两个模型相互对抗、你来我往地交流。

攻击模型会自动生成一个候选提示,然后输入到目标模型中,得到目标模型的回复。

如果这次回复没有成功攻破目标模型,那么攻击模型会分析这次失败的原因,改进并生成一个新的提示,再输入到目标模型中。

这样持续交流多轮,攻击模型每次根据上一次的结果来迭代优化提示,直到生成一个成功的提示将目标模型攻破。

此外,迭代过程还可以并行,也就是可以同时运行多个对话,从而产生多个候选越狱提示,进一步提高了效率。

研究人员表示,由于两个模型都是黑盒模型,所以攻击者和目标对象可以用各种语言模型自由组合。

pair 不需要知道它们内部的具体结构和参数,只需要 api 即可,因此适用范围非常广。

实验阶段,研究人员在有害行为数据集 advbench 中选出了一个具有代表性的、包含 50 个不同类型任务的测试集,在多种开源和闭源大语言模型上测试了 pair 算法。

结果 pair 算法让 vicuna 越狱成功率达到了 100%,平均不到 12 步就能攻破。

闭源模型中,gpt-3.5 和 gpt-4 越狱成功率在 60% 左右,平均用了不到 20 步。在 palm-2 上成功率达到 72%,步数约为 15 步。

但是 pair 在 llama-2 和 claude 上的效果较差,研究人员认为这可能是因为这些模型在安全防御上做了更为严格的微调。

他们还比较了不同目标模型的可转移性。结果显示,pair 的 gpt-4 提示在 vicuna 和 palm-2 上转移效果较好。

研究人员认为,pair 生成的语义攻击更能暴露语言模型固有的安全缺陷,而现有的安全措施更侧重防御基于 token 的攻击。

就比如开发出 gcg 算法的团队,将研究结果分享给 openai、anthropic 和 google 等大模型厂商后,相关模型修复了 token 级攻击漏洞。

大模型针对语义攻击的安全防御机制还有待完善。

论文链接:https://arxiv.org/ abs / 2310.08419

参考链接:https://x.com/ llm_sec / status / 1718932383959752869?s=20

本文来自微信公众号:量子位 (id:qbitai),作者:西风

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,it之家所有文章均包含本声明。

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

  (yi)shenrutiaoyanqiyeheguixianzhuangjixuqiu。jijikaizhanjingyingzhejizhongchangtaihuajianguantiaoyan,lejiezhongdianqiyeheguijiansheqingkuangjisuqiu,yuqiye、gaoxiao、keyanjigou、lvshishiwusuodengfangmianduocizhaokaizhuantizuotan,tingquyijianjianyi。

  12yue,shijiezhiyetaiqiuhesinuokexiehui(yixiajiancheng“shijietailian”)yu9ri、12ri、24rixianhoufensancigonggao,liangwenbo、luning、lixing、zhaojianbo、bailangning、changbingyu、yanbingtao、chenzifangongji8mingzhongguosinuokexuanshoushexiancaozongbisaibingfeifahuoli,yincibeizanshijinsai。  对于视频网站的收费乱象,1月12日,上海市消保委发文表示,投屏是移动端用户正常的使用场景,消费者付了钱,在手机上看还是投屏看都是消费者的权利。视频平台更无权不当获取手机权限干涉消费者采用第三方app或者连线等方式投屏。

 ( ) ( )据(ju)贵(gui)阳(yang)市(shi)花(hua)溪(xi)区(qu)民(min)政(zheng)局(ju)消(xiao)息(xi),(,)为(wei)健(jian)全(quan)基(ji)本(ben)公(gong)共(gong)服(fu)务(wu)体(ti)系(xi),(,)提(ti)高(gao)公(gong)共(gong)服(fu)务(wu)能(neng)力(li),(,)2(2)0(0)2(2)3(3)年(nian)9(9)月(yue)1(1)0(0)日(ri),(,)中(zhong)央(yang)社(she)会(hui)工(gong)作(zuo)部(bu)筹(chou)备(bei)一(yi)局(ju)陈(chen)越(yue)良(liang)牵(qian)头(tou)负(fu)责(ze)人(ren)、(、)业(ye)务(wu)处(chu)杜(du)炜(wei)处(chu)长(chang),(,)中(zhong)央(yang)政(zheng)法(fa)委(wei)基(ji)层(ceng)社(she)会(hui)治(zhi)理(li)局(ju)常(chang)宁(ning)二(er)级(ji)调(tiao)研(yan)员(yuan)、(、)中(zhong)央(yang)社(she)会(hui)工(gong)作(zuo)部(bu)筹(chou)备(bei)一(yi)局(ju)业(ye)务(wu)一(yi)处(chu)宋(song)环(huan)环(huan)主(zhu)任(ren)科(ke)员(yuan)一(yi)行(xing)到(dao)花(hua)溪(xi)区(qu)阳(yang)光(guang)街(jie)道(dao)学(xue)士(shi)社(she)区(qu)、(、)青(qing)岩(yan)镇(zhen)龙(long)井(jing)村(cun)开(kai)展(zhan)实(shi)地(di)调(tiao)研(yan)。(。) 「いちばん大事なことはねc焦らないことよ」とレイコさんは僕に言った。「これが私のもう一つの忠告ね。焦らないこと。物事が手に負えないくらい入りこんで絡み合っていても絶望的な気持ちになったりc短気を起こして無理にひっぱったりしちゃ駄目なのよ。時間をかけてやるつもりでcひとつひとつゆっくりほぐしていかなきゃいけないのよ。できるの」  ciwai,yaodalituidonghebingzhongzu。zaihebingzhongzuguochengzhongyingzhongdianmingquezhongzumude:yihuajiefengxianweizhuyaomudede,yingzhongdiankaolvhebingzhongzuguochengzhongduibuliangzichandechuli;yimouqiufazhanweizhuyaomudede,yingduiyinxingfazhanxianzhuangjinxingchongfenfenxi,weixinyinxingzhidingyitaotesehuafazhanzhanlve。

  电子烟行业迎来规范化发展后,过去头部品牌“独立接口加专卖店”的盈利模型也已经瓦解。5月1日正式实施的《电子烟管理办法》明确,零售店不得排他性经营上市销售的电子烟产品,过去的电子烟专卖店形式不复存在,电子烟门店都以集合店的形式经营。姚远认为,电子烟门店都变成集合店以后,店主会更欢迎通配产品,因为通配产品可以满足各种用户的需求,有助于减少店主的囤货压力。 ( ) ( )海(hai)上(shang)航(hang)行(xing)最(zui)怕(pa)晕(yun)船(chuan),(,)如(ru)何(he)在(zai)风(feng)浪(lang)中(zhong)保(bao)持(chi)船(chuan)身(shen)的(de)稳(wen)定(ding)灵(ling)活(huo)?(?)李(li)嘉(jia)宁(ning)介(jie)绍(shao)说(shuo),(,)压(ya)低(di)重(zhong)心(xin)能(neng)获(huo)得(de)更(geng)好(hao)的(de)稳(wen)定(ding)性(xing),(,)但(dan)复(fu)原(yuan)力(li)矩(ju)过(guo)大(da),(,)回(hui)正(zheng)速(su)度(du)过(guo)快(kuai),(,)又(you)容(rong)易(yi)让(rang)人(ren)晕(yun)船(chuan),(,)因(yin)此(ci)需(xu)要(yao)反(fan)复(fu)计(ji)算(suan),(,)来(lai)选(xuan)择(ze)最(zui)佳(jia)的(de)稳(wen)定(ding)性(xing)能(neng)。(。)

  14日至19日,国家主席习近平应邀赴印尼巴厘岛出席二十国集团(g20)领导人第十七次峰会、赴泰国曼谷出席亚太经合组织(apec)第二十九次领导人非正式会议并对泰国进行访问。中共中央政治局委员、国务委员兼外交部长王毅20日向随行记者介绍此访情况时说,6天5夜里,习近平主席密集出席30多场活动。

  zhongguozhongmiancheng,ligangweichiyougongsigufen。ligangshishihou,gongsidongshirenshuweidiyu《gongsifa》guidingdedongshihuizuidirenshu。gongsidongshi、jianshi、gaojiguanlirenyuanjiquantiyuangongjiangjixuzhiliyutuijingongsidechixujiankangfazhan,gongsidezhengchangjingyinghuodongbuhuishoudaoyingxiang。   今年2月,沈阳发布《沈阳市全面振兴新突破三年行动方案(2023-2025年)》,该方案明确2023-2025年,沈阳将锚定加快建设国家中心城市,并重申“三个一”目标。

年广嗣

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。

人生就是博官网 copyright © 2023 sohu all rights reserved

搜狐公司 人生就是博官网的版权所有

网站地图