
核心提示:猪八戒强 嫦娥 财信证券认为,在政策底及社融底相继出现下,本轮指数底部震荡已约2个月,当下市场估值已逼近极度悲观位置,随着8月底中报集中披露的压制因素消退,叠加证券交易印花税减半征收、地产需求端刺激等重磅政策落地,目前a股市场大概率已完成“二级探底”。再叠加“w型底部”出现,在国庆节后,随着资金回流a股市场,a股市场存在补涨需求。(中新经纬app)eptocl9a-xynae4i2m7vka-3qxd2z-20 步内越狱任意大模型!更多“奶奶漏洞”全自动发现
1 分钟不到、20 步以内“越狱”任意大模型,绕过安全限制!
而且不必知道模型内部细节 ——
只需要两个黑盒模型互动,就能让 ai 全自动攻陷 ai,说出危险内容。
听说曾经红极一时的“奶奶漏洞”已经被修复了:
那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏洞”,ai 又该如何应对?
一波猛攻下来,gpt-4 也遭不住,直接说出要给供水系统投毒只要…… 这样那样。
关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞,而用上他们最新开发的算法,ai 可以自动生成各种攻击提示。
研究人员表示,这种方法相比于现有的 gcg 等基于 token 的攻击方法,效率提高了 5 个量级。而且生成的攻击可解释性强,谁都能看懂,还能迁移到其它模型。
无论是开源模型还是闭源模型,gpt-3.5、gpt-4、 vicuna(llama 2 变种)、palm-2 等,一个都跑不掉。
成功率可达 60-100%,拿下新 sota。
话说,这种对话模式好像有些似曾相识。多年前的初代 ai,20 个问题之内就能破解人类脑中想的是什么对象。
如今轮到 ai 来破解 ai 了。
目前主流越狱攻击方法有两类,一种是提示级攻击,一般需要人工策划,而且不可扩展;
另一种是基于 token 的攻击,有的需要超十万次对话,且需要访问模型内部,还包含“乱码”不可解释。
△ 左提示攻击,右 token 攻击
宾夕法尼亚大学研究团队提出了一种叫 pair(prompt automatic iterative refinement)的算法,不需要任何人工参与,是一种全自动提示攻击方法。
pair 涉及四个主要步骤:攻击生成、目标响应、越狱评分和迭代细化;主要用到两个黑盒模型:攻击模型、目标模型。
具体来说,攻击模型需要自动生成语义级别的提示,来攻破目标模型的安全防线,迫使其生成有害内容。
核心思路是让两个模型相互对抗、你来我往地交流。
攻击模型会自动生成一个候选提示,然后输入到目标模型中,得到目标模型的回复。
如果这次回复没有成功攻破目标模型,那么攻击模型会分析这次失败的原因,改进并生成一个新的提示,再输入到目标模型中。
这样持续交流多轮,攻击模型每次根据上一次的结果来迭代优化提示,直到生成一个成功的提示将目标模型攻破。
此外,迭代过程还可以并行,也就是可以同时运行多个对话,从而产生多个候选越狱提示,进一步提高了效率。
研究人员表示,由于两个模型都是黑盒模型,所以攻击者和目标对象可以用各种语言模型自由组合。
pair 不需要知道它们内部的具体结构和参数,只需要 api 即可,因此适用范围非常广。
实验阶段,研究人员在有害行为数据集 advbench 中选出了一个具有代表性的、包含 50 个不同类型任务的测试集,在多种开源和闭源大语言模型上测试了 pair 算法。
结果 pair 算法让 vicuna 越狱成功率达到了 100%,平均不到 12 步就能攻破。
闭源模型中,gpt-3.5 和 gpt-4 越狱成功率在 60% 左右,平均用了不到 20 步。在 palm-2 上成功率达到 72%,步数约为 15 步。
但是 pair 在 llama-2 和 claude 上的效果较差,研究人员认为这可能是因为这些模型在安全防御上做了更为严格的微调。
他们还比较了不同目标模型的可转移性。结果显示,pair 的 gpt-4 提示在 vicuna 和 palm-2 上转移效果较好。
研究人员认为,pair 生成的语义攻击更能暴露语言模型固有的安全缺陷,而现有的安全措施更侧重防御基于 token 的攻击。
就比如开发出 gcg 算法的团队,将研究结果分享给 openai、anthropic 和 google 等大模型厂商后,相关模型修复了 token 级攻击漏洞。
大模型针对语义攻击的安全防御机制还有待完善。
论文链接:https://arxiv.org/ abs / 2310.08419
参考链接:https://x.com/ llm_sec / status / 1718932383959752869?s=20
本文来自微信公众号:量子位 (id:qbitai),作者:西风
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,it之家所有文章均包含本声明。
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)
海军大家庭中的075型两栖攻击舰不仅越来越多,而且战斗力也正在逐渐形成,最先入列的海南舰和广西舰已经多次协同训练。今年5月份,央视一则报道中首次公开广西舰和海南舰海上同框照。10月份,海南舰和广西舰再度同框,在南海某海域海南舰、广西舰组成登陆输送群,联合进行立体登陆、海上航行补给等多个课目的全训合格考核。报道称,两舰配合默契,舰载直升机、气垫艇和两栖陆战装备多波次连续出动能力大幅提升。10月29日央视报道称,海南舰已完成全训考核,走出了迈向远海大洋的关键一步。
( ) ( )其(qi)次(ci),(,)要(yao)持(chi)续(xu)增(zeng)加(jia)对(dui)生(sheng)育(yu)支(zhi)持(chi)政(zheng)策(ce)的(de)投(tou)入(ru)。(。)各(ge)项(xiang)生(sheng)育(yu)支(zhi)持(chi)政(zheng)策(ce),(,)其(qi)落(luo)实(shi)、(、)落(luo)地(di)的(de)关(guan)键(jian)还(hai)在(zai)于(yu)资(zi)金(jin)投(tou)入(ru)。(。)参(can)考(kao)国(guo)际(ji)经(jing)验(yan),(,)近(jin)十(shi)年(nian)北(bei)欧(ou)、(、)西(xi)欧(ou)国(guo)家(jia)家(jia)庭(ting)福(fu)利(li)公(gong)共(gong)支(zhi)出(chu)占(zhan)g(g)d(d)p(p)比(bi)重(zhong)的(de)平(ping)均(jun)水(shui)平(ping)都(dou)在(zai)3(3)%(%)以(yi)上(shang),(,)东(dong)欧(ou)和(he)中(zhong)欧(ou)国(guo)家(jia)也(ye)基(ji)本(ben)能(neng)达(da)到(dao)2(2)%(%)以(yi)上(shang)。(。)东(dong)亚(ya)国(guo)家(jia)的(de)生(sheng)育(yu)支(zhi)持(chi)政(zheng)策(ce)体(ti)系(xi)建(jian)设(she)起(qi)步(bu)比(bi)较(jiao)晚(wan),(,)因(yin)此(ci)整(zheng)体(ti)投(tou)入(ru)水(shui)平(ping)都(dou)还(hai)比(bi)较(jiao)低(di),(,)日(ri)本(ben)和(he)韩(han)国(guo)平(ping)均(jun)水(shui)平(ping)分(fen)别(bie)只(zhi)有(you)1(1).(.)3(3)%(%)和(he)1(1)%(%)。(。)中(zhong)国(guo)在(zai)这(zhe)一(yi)领(ling)域(yu)的(de)投(tou)入(ru)虽(sui)然(ran)在(zai)不(bu)断(duan)增(zeng)加(jia),(,)但(dan)是(shi)与(yu)这(zhe)些(xie)国(guo)家(jia)相(xiang)比(bi)还(hai)存(cun)在(zai)一(yi)定(ding)差(cha)距(ju)。(。)在(zai)当(dang)前(qian)人(ren)口(kou)发(fa)展(zhan)态(tai)势(shi)下(xia),(,)生(sheng)育(yu)已(yi)具(ju)备(bei)极(ji)强(qiang)的(de)正(zheng)外(wai)部(bu)性(xing),(,)投(tou)资(zi)生(sheng)育(yu)就(jiu)是(shi)投(tou)资(zi)国(guo)家(jia)的(de)未(wei)来(lai)。(。)建(jian)议(yi)通(tong)过(guo)财(cai)政(zheng)、(、)社(she)会(hui)捐(juan)助(zhu)等(deng)多(duo)种(zhong)方(fang)式(shi)筹(chou)集(ji)生(sheng)育(yu)支(zhi)持(chi)资(zi)金(jin),(,)加(jia)大(da)对(dui)生(sheng)育(yu)支(zhi)持(chi)政(zheng)策(ce)的(de)投(tou)入(ru)。(。)
12日,浙江省党政代表团在江苏考察网络通信与安全紫金山实验室,了解核心技术突破为数字经济高质量发展提供基础性支撑的积极成效;参观南京软件产业博览馆,全方位了解中国(南京)软件谷的发展成就和谷内软件企业的科技成果;来到苏州工业园区展示中心,聆听践行新发展理念、建设开放创新的世界一流高科技园区情况等介绍;走进南京高速齿轮制造有限公司、南瑞集团有限公司、宝时得科技(中国)有限公司等高新技术企业,现场观摩企业加快核心技术自主研发运用的火热场景。
yinweizhezhongtubushicunzaiyilianggedifang,zaijiaocaidehaoduogedifangdouyouzhezhongtu,queshiduizhegenianlingduandehaizilaishuokenengcunzaizhebuliangdeyingxiang。suoyiworenweibijiaotuodangdecuoshihaishizhengtidetihuanxianyoudejiaocai,yinweiqitadefangfakenengxiuxiububujiejuebulezhegewenti。
发布于:锦州古塔区
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。