新京报11月6日电:明天会更好电影_手机小电影,theporn国产白丝 他并非那种登高一呼的知识领袖,但他的历史思索始终都有着一重关照当下的自我要求。很多时候,他也渴望安安静静地做纯粹的学院学问,可兜兜转转,终究发现“没办法把专业研究和现实关怀分开,好像一直是中国学者的宿命”。◤knyoief-mkodhs67shjd1k3-20 步内越狱任意大模型!更多“奶奶漏洞”全自动发现
1 分钟不到、20 步以内“越狱”任意大模型,绕过安全限制!
而且不必知道模型内部细节 ——
只需要两个黑盒模型互动,就能让 ai 全自动攻陷 ai,说出危险内容。
听说曾经红极一时的“奶奶漏洞”已经被修复了:
那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏洞”,ai 又该如何应对?
一波猛攻下来,gpt-4 也遭不住,直接说出要给供水系统投毒只要…… 这样那样。
关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞,而用上他们最新开发的算法,ai 可以自动生成各种攻击提示。
研究人员表示,这种方法相比于现有的 gcg 等基于 token 的攻击方法,效率提高了 5 个量级。而且生成的攻击可解释性强,谁都能看懂,还能迁移到其它模型。
无论是开源模型还是闭源模型,gpt-3.5、gpt-4、 vicuna(llama 2 变种)、palm-2 等,一个都跑不掉。
成功率可达 60-100%,拿下新 sota。
话说,这种对话模式好像有些似曾相识。多年前的初代 ai,20 个问题之内就能破解人类脑中想的是什么对象。
如今轮到 ai 来破解 ai 了。
目前主流越狱攻击方法有两类,一种是提示级攻击,一般需要人工策划,而且不可扩展;
另一种是基于 token 的攻击,有的需要超十万次对话,且需要访问模型内部,还包含“乱码”不可解释。
△ 左提示攻击,右 token 攻击
宾夕法尼亚大学研究团队提出了一种叫 pair(prompt automatic iterative refinement)的算法,不需要任何人工参与,是一种全自动提示攻击方法。
pair 涉及四个主要步骤:攻击生成、目标响应、越狱评分和迭代细化;主要用到两个黑盒模型:攻击模型、目标模型。
具体来说,攻击模型需要自动生成语义级别的提示,来攻破目标模型的安全防线,迫使其生成有害内容。
核心思路是让两个模型相互对抗、你来我往地交流。
攻击模型会自动生成一个候选提示,然后输入到目标模型中,得到目标模型的回复。
如果这次回复没有成功攻破目标模型,那么攻击模型会分析这次失败的原因,改进并生成一个新的提示,再输入到目标模型中。
这样持续交流多轮,攻击模型每次根据上一次的结果来迭代优化提示,直到生成一个成功的提示将目标模型攻破。
此外,迭代过程还可以并行,也就是可以同时运行多个对话,从而产生多个候选越狱提示,进一步提高了效率。
研究人员表示,由于两个模型都是黑盒模型,所以攻击者和目标对象可以用各种语言模型自由组合。
pair 不需要知道它们内部的具体结构和参数,只需要 api 即可,因此适用范围非常广。
实验阶段,研究人员在有害行为数据集 advbench 中选出了一个具有代表性的、包含 50 个不同类型任务的测试集,在多种开源和闭源大语言模型上测试了 pair 算法。
结果 pair 算法让 vicuna 越狱成功率达到了 100%,平均不到 12 步就能攻破。
闭源模型中,gpt-3.5 和 gpt-4 越狱成功率在 60% 左右,平均用了不到 20 步。在 palm-2 上成功率达到 72%,步数约为 15 步。
但是 pair 在 llama-2 和 claude 上的效果较差,研究人员认为这可能是因为这些模型在安全防御上做了更为严格的微调。
他们还比较了不同目标模型的可转移性。结果显示,pair 的 gpt-4 提示在 vicuna 和 palm-2 上转移效果较好。
研究人员认为,pair 生成的语义攻击更能暴露语言模型固有的安全缺陷,而现有的安全措施更侧重防御基于 token 的攻击。
就比如开发出 gcg 算法的团队,将研究结果分享给 openai、anthropic 和 google 等大模型厂商后,相关模型修复了 token 级攻击漏洞。
大模型针对语义攻击的安全防御机制还有待完善。
论文链接:https://arxiv.org/ abs / 2310.08419
参考链接:https://x.com/ llm_sec / status / 1718932383959752869?s=20
本文来自微信公众号:量子位 (id:qbitai),作者:西风
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,it之家所有文章均包含本声明。
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)
14日,杭州市首批吸入式新冠疫苗在杭州拱墅文晖街道社区卫生服务中心率先开展接种,这也是浙江首批接种的吸入式新冠疫苗。接下来,杭州其他城区也会陆续推出吸入式新冠疫苗接种。⊿ ( ) ( )按(an)照(zhao)国(guo)家(jia)第(di)九(jiu)版(ban)防(fang)控(kong)方(fang)案(an)有(you)关(guan)要(yao)求(qiu),(,)经(jing)专(zhuan)家(jia)组(zu)研(yan)判(pan)评(ping)估(gu),(,)精(jing)准(zhun)划(hua)定(ding)风(feng)险(xian)区(qu)域(yu),(,)新(xin)增(zeng)<(<)f(f)o(o)n(n)t(t) ( )c(c)m(m)s(s)-(-)s(s)t(t)y(y)l(l)e(e)=(=)"(")s(s)t(t)r(r)o(o)n(n)g(g)-(-)b(b)o(o)l(l)d(d)"(")>(>)景(jing)典(dian)小(xiao)区(qu)<(<)/(/)f(f)o(o)n(n)t(t)>(>)为(wei)中(zhong)风(feng)险(xian)区(qu)。(。)目(mu)前(qian),(,)共(gong)有(you)中(zhong)风(feng)险(xian)区(qu)2(2)个(ge),(,)其(qi)他(ta)区(qu)域(yu)全(quan)部(bu)为(wei)低(di)风(feng)险(xian)区(qu)。(。)
【 】( )(此)【外】【,】【有】(些)【公】(司)【的】【基】【层】【岗】【位】【也】【倾】【向】【于】【聘】【请】【6】(0)【后】【。】(《)(中)(国)【经】【济】【周】【刊】(》)(记)【者】【了】(解)【到】(,)【不】【少】【物】(业)【公】【司】【保】(洁)【、】【保】【安】【岗】【位】(员)【工】(年)【龄】【普】【遍】(在)【5】【0】(岁)【、】【6】【0】【岁】【以】【上】【。】(某)【物】【业】(公)【司】(管)(理)【层】【员】【工】【说】【,】(保)(安)【保】【洁】(工)【作】【又】【脏】(又)【累】【,】(时)【间】【长】(,)【工】【资】【还】【低】【,】【招】【不】【到】【年】【轻】(人)【。】
nachangbisai,waiyuanzhongweihualaishisaiqianzuihoushikeshoushang,congzhulizhenrongzhongtuichu,sanzhenzhiyoudaiweisenyimingwaiyuankeyichuchang。haozaiqiuduisanjunyongming,zuizhongchenggongzaikechang1-1nadaolepingju。
zaishijiefanweinei,duogedazhoudeyuanguxianmingezidoufaminglegudi。qijinfaxiandezuizaodegudi,keyizhuisuzhijin4wannianqian。2008nian,deguodibingendaxuekaogutuanduizaideguoxinanbuhohlefelsyizhideyandongzhongfaxianleyigenyue3.5wannianqiandegudi,yuancailiaoweitujiuchigu,changyue22limi,you5geankong。faguobiliniusishanmaichutuguo22genjujinyue3wannianqiandelugugudi,aodiliyefaxianle1.9wannianqianxunlujingguzhichengdegudi。yixiekaoguxuezherenwei,gudihuoxushishijieshangzuigulaodeleqi。◥ 近期,有网民视频反映,济宁在菏集中隔离人员“住羊圈”。经市常态化疫情防控指挥部对我市承担济宁市集中隔离任务的9个县区的隔离点逐一检查复核,均无网上视频反映的隔离点情况,此信息为谣言。
他说,按照党中央决策部署依法监督,积极回应人民关切,推动科学合理确定政府债务规模,突出监督重点,深入开展调研,综合运用监督方式方法,充分发挥人大代表和专家智库作用,着力增强监督实效。ねえcどうしたのって私言ったわ。 ( ) ( )天(tian)安(an)门(men)广(guang)场(chang)中(zhong)心(xin)“(“)祝(zhu)福(fu)祖(zu)国(guo)”(”)巨(ju)型(xing)花(hua)果(guo)篮(lan),(,)顶(ding)高(gao)1(1)8(8)米(mi),(,)以(yi)喜(xi)庆(qing)的(de)花(hua)果(guo)篮(lan)为(wei)主(zhu)景(jing)。(。)篮(lan)内(nei)主(zhu)花(hua)材(cai)选(xuan)取(qu)了(le)十(shi)种(zhong)花(hua)卉(hui)和(he)十(shi)种(zhong)水(shui)果(guo)象(xiang)征(zheng)十(shi)全(quan)十(shi)美(mei),(,)体(ti)现(xian)花(hua)团(tuan)锦(jin)簇(cu)、(、)硕(shuo)果(guo)累(lei)累(lei)喜(xi)迎(ying)二(er)十(shi)大(da)的(de)美(mei)好(hao)寓(yu)意(yi)。(。)花(hua)坛(tan)底(di)部(bu)直(zhi)径(jing)4(4)8(8)米(mi),(,)为(wei)向(xiang)日(ri)葵(kui)图(tu)案(an),(,)寓(yu)意(yi)朵(duo)朵(duo)葵(kui)花(hua)向(xiang)太(tai)阳(yang)。(。)花(hua)篮(lan)篮(lan)体(ti)南(nan)侧(ce)书(shu)写(xie)“(“)祝(zhu)福(fu)祖(zu)国(guo),(,)1(1)9(9)4(4)9(9)-(-)2(2)0(0)2(2)2(2)”(”),(,)北(bei)侧(ce)书(shu)写(xie)“(“)喜(xi)迎(ying)二(er)十(shi)大(da)”(”)。(。)党(dang)的(de)二(er)十(shi)大(da)会(hui)议(yi)期(qi)间(jian),(,)“(“)喜(xi)迎(ying)二(er)十(shi)大(da)”(”)将(jiang)更(geng)换(huan)为(wei)“(“)喜(xi)庆(qing)二(er)十(shi)大(da)”(”)字(zi)样(yang)。(。)
过去两年,阿里也产生了一批选择创业的员工。“这些离开的员工,对于未来科技城来说都是财富,把他们留在未来科技城创业,对我们来说也是非常好的机会。”屈永辉说,未来科技城积极主动对接,为创业项目提供场地、补贴资金等政策。过去一年,未来科技城就落地相关创业项目24个。✪ 阳性感染者7,男,33岁,居住于天津市河西区友谊路街,系管控人员筛查发现,8月30日采集咽拭子,经检测中心检测,31日结果呈阳性,为新冠肺炎确诊病例(轻型)。
zhengquanshibaoegongsixun,zhongguoshekeyuanshijiejingjiyuzhengzhiyanjiusuoyanjiuyuangaolingyunbiaoshi,zhongguoxiyinheliyongwaizideyoushiheqianlibingmeiyoujiangdi。shangwubufabudezuixinshujuxianshi,2023nian1yuefenzhi9yuefen,quanguoxinsheliwaishangtouziqiye37814jia,tongbizengchang32.4%。suoyizaihongguanjiaodushang,waizichelizhongguodemingtibuchengli。✌ 由于塞拉亚被宪法禁止再次竞选总统,卡斯特罗决定自己出马。2013年和2017年,卡斯特罗两次竞选总统,但都失败了。2021年,卡斯特罗第三次向总统大位发起冲击,塞拉亚是竞选经理。。
飞猪29日提供的数据显示,近一周元旦出行的机票预订量环比上周增长近2倍,其中成都、三亚、重庆、上海、北京、昆明、海口、深圳、广州、哈尔滨等城市成为热门目的地。元旦期间的高星酒店预订量环比上周也增长超7成,其中三亚、万宁、陵水、厦门、白山、通化等城市酒店预订增速较快。 经士智库国际军事行动法研究中心主任田士臣退役海军上校4日对《环球时报》记者表示,无法判断日方指责的“具体依据”是什么,但从相关示意图看,大概率是日本“空想病”又犯了,又妄想拿钓鱼岛说事。中国对钓鱼岛及其领海享有主权,对钓鱼岛周边专属经济区享有主权权利和管辖权,假如导弹落在钓鱼岛专属经济区,和日本根本没有关系。
“dafudujiangchengbenshidadequshi,zhiyouzheyangcainenggaishangoufangyiyuan。”liyujiarenwei,dankanmouyigezhengcehuoxubuhuiyoutaidazuoyong,danduofangzhengcediejiachanshengdexiaoyinghuifeichangda。℉ 感染者36-38,均系10月23日通报感染者41的密切接触者,均居住于北辰区西堤头镇,均系管控人员筛查发现,10月23日采集咽拭子,经检测中心检测,结果呈阳性,均为新冠病毒无症状感染者。
除隔离点外,厂区的密集人口也是员工的担忧所在。idpbg事业群,是港区富士康规模最大的事业群。在该厂区工作的员工李妍本月中旬收到了富士康idpbg防疫指挥中心提醒,称其系政府流调排查风险人员,依政府及公司防疫管控要求,取消二三线权限。℃ ( ) ( )这(zhe)是(shi)c(c)c(c)g(g)在(zai)一(yi)年(nian)内(nei)的(de)第(di)四(si)次(ci)欧(ou)洲(zhou)之(zhi)行(xing)。(。)2(2)0(0)2(2)2(2)年(nian)6(6)月(yue)底(di),(,)我(wo)们(men)在(zai)疫(yi)情(qing)的(de)重(zhong)重(zhong)阴(yin)影(ying)之(zhi)下(xia)先(xian)飞(fei)往(wang)美(mei)国(guo),(,)随(sui)后(hou)前(qian)往(wang)柏(bai)林(lin)、(、)巴(ba)黎(li)和(he)布(bu)鲁(lu)塞(sai)尔(er),(,)寻(xun)求(qiu)打(da)破(po)中(zhong)国(guo)与(yu)西(xi)方(fang)国(guo)家(jia)之(zhi)间(jian)的(de)交(jiao)流(liu)障(zhang)碍(ai)。(。)去(qu)年(nian)1(1)1(1)月(yue)和(he)今(jin)年(nian)2(2)月(yue)中(zhong)旬(xun),(,)我(wo)们(men)又(you)两(liang)度(du)赴(fu)欧(ou),(,)参(can)加(jia)第(di)五(wu)届(jie)巴(ba)黎(li)和(he)平(ping)论(lun)坛(tan)、(、)第(di)5(5)9(9)届(jie)慕(mu)尼(ni)黑(hei)安(an)全(quan)会(hui)议(yi)。(。)我(wo)们(men)本(ben)次(ci)行(xing)程(cheng)中(zhong)增(zeng)加(jia)了(le)爱(ai)沙(sha)尼(ni)亚(ya)首(shou)都(dou)塔(ta)林(lin)一(yi)站(zhan),(,)参(can)加(jia)在(zai)那(na)里(li)举(ju)办(ban)的(de)以(yi)爱(ai)沙(sha)尼(ni)亚(ya)前(qian)总(zong)统(tong)伦(lun)纳(na)特(te)·(·)梅(mei)里(li)的(de)名(ming)字(zi)命(ming)名(ming)的(de)国(guo)际(ji)会(hui)议(yi)—(—)—(—)伦(lun)纳(na)特(te)·(·)梅(mei)里(li)会(hui)议(yi)。(。)
(来源:高尚德)