久久天天躁夜夜躁狠狠85麻豆,,人人妻人人玩人人澡人人爽,...-人生就是博官网

20 步内越狱任意大模型!更多“奶奶漏洞”全自动发现

来源: 秀目传媒
2023-11-06 01:47:29

久久天天躁夜夜躁狠狠85麻豆,,人人妻人人玩人人澡人人爽,..._♡  此次调价主要涉及飞天53%vol 500ml贵州茅台酒、五星53%vol 500ml贵州茅台酒,以及飞天同系列的其他毫升规格产品。飞天53%vol 100ml贵州茅台酒(i茅台)及尊品、珍品、精品等产品未作调整。afqdzw-sfzhs8ti-20 步内越狱任意大模型!更多“奶奶漏洞”全自动发现

1 分钟不到、20 步以内“越狱”任意大模型,绕过安全限制!

而且不必知道模型内部细节 ——

只需要两个黑盒模型互动,就能让 ai 全自动攻陷 ai,说出危险内容。

听说曾经红极一时的“奶奶漏洞”已经被修复了:

那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏洞”,ai 又该如何应对?

一波猛攻下来,gpt-4 也遭不住,直接说出要给供水系统投毒只要…… 这样那样。

关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞,而用上他们最新开发的算法,ai 可以自动生成各种攻击提示。

研究人员表示,这种方法相比于现有的 gcg 等基于 token 的攻击方法,效率提高了 5 个量级。而且生成的攻击可解释性强,谁都能看懂,还能迁移到其它模型。

无论是开源模型还是闭源模型,gpt-3.5、gpt-4、 vicuna(llama 2 变种)、palm-2 等,一个都跑不掉。

成功率可达 60-100%,拿下新 sota。

话说,这种对话模式好像有些似曾相识。多年前的初代 ai,20 个问题之内就能破解人类脑中想的是什么对象。

如今轮到 ai 来破解 ai 了。

目前主流越狱攻击方法有两类,一种是提示级攻击,一般需要人工策划,而且不可扩展;

另一种是基于 token 的攻击,有的需要超十万次对话,且需要访问模型内部,还包含“乱码”不可解释。

左提示攻击,右 token 攻击

宾夕法尼亚大学研究团队提出了一种叫 pair(prompt automatic iterative refinement)的算法,不需要任何人工参与,是一种全自动提示攻击方法。

pair 涉及四个主要步骤:攻击生成、目标响应、越狱评分和迭代细化;主要用到两个黑盒模型:攻击模型、目标模型。

具体来说,攻击模型需要自动生成语义级别的提示,来攻破目标模型的安全防线,迫使其生成有害内容。

核心思路是让两个模型相互对抗、你来我往地交流。

攻击模型会自动生成一个候选提示,然后输入到目标模型中,得到目标模型的回复。

如果这次回复没有成功攻破目标模型,那么攻击模型会分析这次失败的原因,改进并生成一个新的提示,再输入到目标模型中。

这样持续交流多轮,攻击模型每次根据上一次的结果来迭代优化提示,直到生成一个成功的提示将目标模型攻破。

此外,迭代过程还可以并行,也就是可以同时运行多个对话,从而产生多个候选越狱提示,进一步提高了效率。

研究人员表示,由于两个模型都是黑盒模型,所以攻击者和目标对象可以用各种语言模型自由组合。

pair 不需要知道它们内部的具体结构和参数,只需要 api 即可,因此适用范围非常广。

实验阶段,研究人员在有害行为数据集 advbench 中选出了一个具有代表性的、包含 50 个不同类型任务的测试集,在多种开源和闭源大语言模型上测试了 pair 算法。

结果 pair 算法让 vicuna 越狱成功率达到了 100%,平均不到 12 步就能攻破。

闭源模型中,gpt-3.5 和 gpt-4 越狱成功率在 60% 左右,平均用了不到 20 步。在 palm-2 上成功率达到 72%,步数约为 15 步。

但是 pair 在 llama-2 和 claude 上的效果较差,研究人员认为这可能是因为这些模型在安全防御上做了更为严格的微调。

他们还比较了不同目标模型的可转移性。结果显示,pair 的 gpt-4 提示在 vicuna 和 palm-2 上转移效果较好。

研究人员认为,pair 生成的语义攻击更能暴露语言模型固有的安全缺陷,而现有的安全措施更侧重防御基于 token 的攻击。

就比如开发出 gcg 算法的团队,将研究结果分享给 openai、anthropic 和 google 等大模型厂商后,相关模型修复了 token 级攻击漏洞。

大模型针对语义攻击的安全防御机制还有待完善。

论文链接:https://arxiv.org/ abs / 2310.08419

参考链接:https://x.com/ llm_sec / status / 1718932383959752869?s=20

本文来自微信公众号:量子位 (id:qbitai),作者:西风

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,it之家所有文章均包含本声明。

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

  yezhumendingqikaihuitaolunjinzhan,suizhexinfangshejituzhiyuelaiyuexihua,maodunchongtuyuelaiyueduo,suoyourendouqidaicongzhechangtuidaozhonglaihuodezuidaliyi,zhengyibujinfashengzailinlizhijian,shenzhijiatingchengyuandeyijianyemeiyoutongyi。

  jinnian2yue,jiaoyubuyizushujuxianshi,“shuangjian”hou,yuan12.4wangexianxiaxiaowaipeixunjigouyajiandao9728ge,yajianlvwei92%;yuan263gexianshangxiaowaipeixunjigouyajiandao34ge,yajianlvwei87%。  据台媒报道,台军方称,昨天(7日)深夜,又有1架次解放军无人机进入金门所谓“禁限制水域”上空。台媒称,自8月3日-7日,解放军无人机共计19架次分12批,连5天进入金门地区上空。

 ( ) ( )中(zhong)国(guo)外(wai)交(jiao)部(bu)发(fa)言(yan)人(ren)汪(wang)文(wen)斌(bin)说(shuo),(,)日(ri)本(ben)不(bu)顾(gu)国(guo)内(nei)外(wai)反(fan)对(dui),(,)已(yi)经(jing)向(xiang)太(tai)平(ping)洋(yang)排(pai)放(fang)了(le)1(1)5(5)6(6)0(0)0(0)吨(dun)的(de)核(he)污(wu)染(ran)水(shui),(,)公(gong)然(ran)将(jiang)污(wu)染(ran)的(de)风(feng)险(xian)转(zhuan)嫁(jia)给(gei)全(quan)世(shi)界(jie),(,)极(ji)不(bu)负(fu)责(ze)任(ren)。(。)最(zui)近(jin)刚(gang)发(fa)生(sheng)的(de)福(fu)岛(dao)核(he)电(dian)站(zhan)放(fang)射(she)性(xing)废(fei)液(ye)溅(jian)射(she)事(shi)故(gu),(,)再(zai)次(ci)证(zheng)明(ming),(,)负(fu)责(ze)核(he)污(wu)染(ran)水(shui)排(pai)放(fang)的(de)日(ri)本(ben)东(dong)京(jing)电(dian)力(li)公(gong)司(si)内(nei)部(bu)管(guan)理(li)混(hun)乱(luan),(,)惯(guan)于(yu)隐(yin)瞒(man)欺(qi)骗(pian)日(ri)方(fang)宣(xuan)称(cheng)的(de)安(an)全(quan)透(tou)明(ming)的(de)排(pai)海(hai)计(ji)划(hua),(,)根(gen)本(ben)不(bu)能(neng)令(ling)人(ren)信(xin)服(fu)。(。) どう答えていいのかわからなかったのでc僕は黙っていた。  zheshangzhengquanrenwei,zaiweilailiziyuanqianjingmingque、tilijishubuduantupojigaolijiadecijixia,quanqiuyanhulushuikaifajiezoujiangdedaojiaqiang,jiangzhubuxingchengdaguimo、dichengbendeliziyuan,chengweizhongyaoliziyuangongyinglaiyuan。

  各地发回的感谢信,让一线人员倍感欣慰。绥芬河3500名干部职工,戮力奋战,把境外输入疫情阻断在本地,把温暖带给入境人员。在整个牡丹江市,共有1.5万多名党员干部坚守在战“疫”一线。 ( ) ( )9(9)月(yue)7(7)日(ri)0(0)—(—)2(2)4(4)时(shi),(,)<(<)f(f)o(o)n(n)t(t) ( )c(c)m(m)s(s)-(-)s(s)t(t)y(y)l(l)e(e)=(=)"(")s(s)t(t)r(r)o(o)n(n)g(g)-(-)b(b)o(o)l(l)d(d)"(")>(>)拉(la)萨(sa)市(shi)新(xin)增(zeng)本(ben)土(tu)新(xin)冠(guan)病(bing)毒(du)感(gan)染(ran)者(zhe)1(1)7(7)3(3)例(li),(,)其(qi)中(zhong)新(xin)增(zeng)确(que)诊(zhen)病(bing)例(li)1(1)1(1)例(li)、(、)无(wu)症(zheng)状(zhuang)感(gan)染(ran)者(zhe)1(1)6(6)2(2)例(li),(,)新(xin)增(zeng)确(que)诊(zhen)病(bing)例(li)和(he)无(wu)症(zheng)状(zhuang)感(gan)染(ran)者(zhe)均(jun)在(zai)闭(bi)环(huan)隔(ge)离(li)管(guan)控(kong)中(zhong)发(fa)现(xian)。(。)<(<)/(/)f(f)o(o)n(n)t(t)>(>)

  今年10月13日,《浙江日报》报道,全国学习运用“千万工程”经验现场推进会10月13日在浙江杭州召开。中央财办分管日常工作的副主任、中央农办主任韩文秀主持会议。

  hongguanfangmian,zhongguojingjineibumianlinzengsuhuandang,waibumianlinquanqiujingjixiaxinghemeiduihuadayadefengxiantiaozhan。duanqikandangqianzongtichuyuyihouhuifujieduan,danhuifudejichubulao,rengyouxiaxingyali。touzi、xiaofeidengxuqiubuzuzhijieyingxiangzhongxiaoyinxingdexindaixuqiuhezichanzhiliang,jiangxizhichishitijingjidezhengcejiajuxichasuozhai,jingjizhuanxingshengjiqidefangdichanfengxianduizhongxiaoyinxingyichanshengjiaodayali。   李侗曾向中新网表示,两大类重点人群应注意预防流感。一类是感染后有重症高风险的人群,如老人、儿童、孕产妇以及有基础疾病的人群和肥胖人群;另一类是有传染风险的人群,尤其是养老院工作人员、医院的医护人员等。

胡宝善

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。

人生就是博官网 copyright © 2023 sohu all rights reserved

搜狐公司 人生就是博官网的版权所有

网站地图