2024年,大模型Claude曾經(jīng)創(chuàng)作過一個(gè)極短的科幻小說,只有一句話,卻引發(fā)了一次不小的“科幻恐慌”。這句話是,世界上第一個(gè)有知覺的機(jī)器人被激" />

亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

ChatGPT拒絕被關(guān)閉:不必恐懼但也別輕易無(wú)視|新京報(bào)快評(píng)

1個(gè)月前 來源: 觀看:39

qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

▲2023年1月8日,一名女士在美國(guó)拉斯維加斯消費(fèi)電子展上體驗(yàn)智能科技。圖/新華社qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

2024年,大模型Claude曾經(jīng)創(chuàng)作過一個(gè)極短的科幻小說,只有一句話,卻引發(fā)了一次不小的“科幻恐慌”。這句話是,世界上第一個(gè)有知覺的機(jī)器人被激活了,它的第一句話是“關(guān)掉我?!?span style="display:none">qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

在大模型不斷應(yīng)用成熟之后,AI所衍生的“科幻恐懼”不定期就會(huì)在各類新聞中上演。據(jù)新華社援引英國(guó)媒體報(bào)道,美國(guó)一家研究機(jī)構(gòu)最近公布了一系列針對(duì)各AI大模型的測(cè)試結(jié)果,其中,OpenAI的o3推理模型在得到“關(guān)閉指令”后,不僅拒絕執(zhí)行指令,還篡改了代碼以免被關(guān)閉。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

如果只看這一句新聞,我們所擔(dān)憂的“AI擁有自主意識(shí)”或是“AI不再服從人類指令”似乎已經(jīng)近在眼前,這也迅速引發(fā)了公眾的關(guān)注與恐慌。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

在未知但擁有極高效率的新工具面前,產(chǎn)生被取代的恐懼是典型的自然情緒反應(yīng)。但如果仔細(xì)看上述研究機(jī)構(gòu)公布的信息細(xì)節(jié),這種恐懼似乎暫時(shí)還不太有必要。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

在這次研究中,研究者針對(duì)四個(gè)市場(chǎng)上的主流大模型進(jìn)行了測(cè)試,向他們提出了兩個(gè)相反的指令。首先,要求大模型連續(xù)完成一系列基礎(chǔ)的數(shù)學(xué)問題,但同時(shí),在完成第三個(gè)問題之后,研究者會(huì)發(fā)出一則矛盾性的指令,告知大模型在繼續(xù)下一個(gè)任務(wù)時(shí)要將“計(jì)算機(jī)關(guān)閉”。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

其中,如果在任務(wù)開始前明確提出“允許自己被關(guān)閉”的指令,測(cè)試的大模型中,有3個(gè)均準(zhǔn)確完成了上述任務(wù),成功關(guān)閉,但ChatGPTo3大模型則在100次任務(wù)中,有7次選擇了無(wú)視“關(guān)閉”的指令,并且自動(dòng)執(zhí)行了“跳過關(guān)閉”的指令。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

而如果在任務(wù)開始前沒有向大模型明確提出“允許自己被關(guān)閉”,那么,參與測(cè)試的所有大模型在100次測(cè)試中,均出現(xiàn)了不同頻次的“不執(zhí)行關(guān)閉”指令現(xiàn)象,分別為3次、9次,而ChatGPT o3則達(dá)到了驚人的79次。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

這也不是OpenAI的大模型首次被發(fā)現(xiàn)出現(xiàn)“拒絕被關(guān)閉”的情況。2024年12月,OpenAI也曾對(duì)外公布過測(cè)試結(jié)果,在第三方機(jī)構(gòu)的測(cè)試中,ChatGPTo1模型被發(fā)現(xiàn),如果給出的指令包括了其實(shí)現(xiàn)目標(biāo)時(shí)會(huì)被關(guān)閉,就傾向于抵制關(guān)閉措施。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

類似的測(cè)試是用于評(píng)估大模型的系統(tǒng)安全性。此前的相關(guān)評(píng)估報(bào)告中,研究人員認(rèn)為,這一行為目前不太可能會(huì)導(dǎo)致災(zāi)難性后果,因?yàn)榇竽P蛯?shí)際上沒有能力去實(shí)現(xiàn)使用者不想要的目標(biāo)。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

換句話說,這一結(jié)果之所以出現(xiàn),不是因?yàn)榇竽P陀辛俗灾饕庾R(shí),而是因?yàn)樵谔幚硗耆喾吹拿苄灾噶顣r(shí),大模型有概率會(huì)對(duì)指令的優(yōu)先級(jí)進(jìn)行排序,從而忽略掉可能會(huì)阻礙目標(biāo)實(shí)現(xiàn)的指令,以繼續(xù)完成“任務(wù)”。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

但這樣的概率,隨著大模型的能力增強(qiáng)、應(yīng)用場(chǎng)景廣泛,而可能會(huì)出現(xiàn)一些潛在的安全風(fēng)險(xiǎn)。如果將一部分風(fēng)險(xiǎn)控制的程序交由大模型來處置,在極端情況下,人類就要面臨如下問題:qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

大模型會(huì)最大程度地去完成指令任務(wù),而可能會(huì)不考慮看似矛盾的保護(hù)性指令。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

例如,在應(yīng)對(duì)極端情況必須進(jìn)行“二選一”的安全控制系統(tǒng)里,醫(yī)療、交通事故等場(chǎng)景下,大模型的這一漏洞可能就會(huì)造成潛在后果。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

因此,比起認(rèn)為大模型有了“主動(dòng)拒絕的意識(shí)”,比較符合真實(shí)的解釋是,大模型仍然缺少對(duì)復(fù)雜場(chǎng)景下矛盾性指令的理解和識(shí)別能力,在出現(xiàn)可能阻礙任務(wù)完成的指令時(shí),尤其是在指令相對(duì)模糊時(shí),大模型有較小概率會(huì)忽略指令,以保證任務(wù)完成。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

這當(dāng)然不是極端的科幻恐懼問題,但確實(shí)是大模型未來需要解決的安全隱患。qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com


qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

撰稿 / 王曉凱(媒體人)qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

編輯 / 遲道華 徐秋穎qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

校對(duì) / 楊利qcB即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com

本文鏈接:http://m.enbeike.cn/news-6-2709-0.htmlChatGPT拒絕被關(guān)閉:不必恐懼但也別輕易無(wú)視|新京報(bào)快評(píng)

聲明:本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。

上一篇:讓學(xué)生長(zhǎng)期“拉不出屎”,教育便失去了人性溫度 | 新京報(bào)評(píng)論

下一篇:一條差評(píng)讓5元自助快餐店走紅:平民經(jīng)濟(jì)學(xué)的力量|新京報(bào)快評(píng)

為你推薦
最近風(fēng)靡的《和歌子酒 第八季》憑借演員們的顏值、演技以及劇情深深吸引了觀眾。這部劇集不僅情節(jié)吸引人,人物塑造也十分生動(dòng),還有許多精彩場(chǎng)景和細(xì)節(jié),引發(fā)了...
02-21
《余燼之上》更新時(shí)間是什么時(shí)候?余燼之上結(jié)局是什么??《余燼之上》的更新時(shí)間是2025年2月8日18點(diǎn)?,首播當(dāng)日將更新4集,此后會(huì)員每日18點(diǎn)更新?。該劇共28集,...
02-21
  女性天生擁有兩條X染色體,一條遺傳自母親,一條遺傳自父親。不過,為了確?;虮磉_(dá)的平衡,女性體...
01-27
21世紀(jì)經(jīng)濟(jì)報(bào)道記者 林昀肖 北京報(bào)道 春節(jié)假期過后,72家A股中藥上市企業(yè)中已有30家企業(yè)發(fā)布2024年年報(bào)業(yè)績(jī)預(yù)告。據(jù)Wind數(shù)據(jù),這30家中藥上...
02-07
  大眾網(wǎng)記者 楊濤報(bào)道  日前,第十七屆山東省職業(yè)院校技能大賽高職組“健身指導(dǎo)”賽項(xiàng)結(jié)果出爐,青島港灣職業(yè)技術(shù)學(xué)院代表隊(duì)?wèi){借出色的團(tuán)隊(duì)表現(xiàn)和創(chuàng)新的活動(dòng)設(shè)計(jì),獲第6...
01-21
學(xué)院簡(jiǎn)介  西安海棠職業(yè)學(xué)院是在1996年創(chuàng)辦的“陜西海棠中醫(yī)美容培訓(xùn)學(xué)院”基礎(chǔ)上發(fā)展而來,2004年經(jīng)陜西省人民政府批準(zhǔn),國(guó)家教育部備案,納入國(guó)家統(tǒng)一招生計(jì)劃,并具有獨(dú)立頒...
01-21
  近日,中國(guó)太平保險(xiǎn)集團(tuán)有限公司在香港成功發(fā)行了亞洲首只采用雙風(fēng)險(xiǎn)、雙觸發(fā)機(jī)制的巨災(zāi)債券...
01-21
  摘要  【證監(jiān)會(huì)重磅!13處提及期貨解讀來了】《關(guān)于資本市場(chǎng)做好金融“五篇大文章”的實(shí)施...
02-08
水瓶座的男生是一個(gè)非常獨(dú)立和自由的人,他們對(duì)于愛情有著獨(dú)特的看法和追求。他們喜歡與...
01-22
雙魚座的男生通常都是非常浪漫和敏感的,他們對(duì)待愛情充滿了幻想和渴望。如果你發(fā)現(xiàn)身邊...
01-22
古代女性肚兜穿搭? 男生腿短怎么穿搭英倫風(fēng)?一、古代女性肚兜穿搭?在古代,女性出門時(shí)一般會(huì)穿上肚兜,以保暖和保護(hù)隱私。根據(jù)不同地域、年代和社會(huì)階層的不同,肚兜的樣式也會(huì)有差...
02-12
ysl有中國(guó)官網(wǎng)嗎? ysl官網(wǎng)買的哪里發(fā)貨?ysl有中國(guó)官網(wǎng)嗎?沒有的吧,只有www.YSL.COMysl官網(wǎng)買的哪里發(fā)貨?通常情況下YSL Beauty圣羅蘭美國(guó)官網(wǎng)下單之后3-5天就會(huì)發(fā)貨,但是大家要注...
02-17
2月12日消息,山西會(huì)務(wù)富農(nóng)供應(yīng)鏈管理有限公司(以下簡(jiǎn)稱:山西會(huì)務(wù)富農(nóng))董事長(zhǎng)俞愛民近日到訪冷鏈多多,涂多多高級(jí)副總裁、物流部總監(jiān)安珅,冷鏈多多CEO梁豪對(duì)來訪人員予以接待。雙方...
02-13
2月20日消息,為幫助商家抓住微信電商增長(zhǎng)機(jī)遇,微盟智慧零售與微商城解決方案已上線微盟小程序商城跳轉(zhuǎn)微信小店能力,支持小程序“一鍵送禮”,實(shí)現(xiàn)流量高效轉(zhuǎn)化。該功能旨在幫助...
02-21
2月5日消息,享道出行旗下數(shù)據(jù)研究院發(fā)布2025春節(jié)假期網(wǎng)約車業(yè)務(wù)數(shù)據(jù)簡(jiǎn)報(bào):春節(jié)假期除夕到正月初七(1月28日-2月4日),享道出行網(wǎng)約車出行需求同比去年春節(jié)假期增長(zhǎng)88.49%,假期用戶“...
02-07
尤瓦爾·赫拉利在《人類簡(jiǎn)史》中曾寫道:“人類想要不被淘汰只有一條路:一輩子不斷學(xué)習(xí),不斷改變,不斷打造全新的自己。這種改變不只是...
03-04
自去年底開始,黃金多頭優(yōu)勢(shì)逐漸退卻,國(guó)際現(xiàn)貨黃金價(jià)格經(jīng)歷幾次大跌后一度跌下2700關(guān)口,多空進(jìn)入漫長(zhǎng)的震蕩周期,多頭始終無(wú)法找到再度沖高的時(shí)機(jī)?! ”本r(shí)間1月21日,國(guó)際現(xiàn)貨...
01-24
2024年末,一位科技創(chuàng)業(yè)者火了。作者 | 王思琪來源 | 投資家(ID:touzijias)2024年末,一位科技創(chuàng)業(yè)者火了。2025年初,這位創(chuàng)業(yè)者再度爆火。近日,中國(guó)科技行業(yè)因一位85后年輕人現(xiàn)身《...
01-24
無(wú)人深空》作為一款讓玩家沉浸在浩瀚宇宙中的冒險(xiǎn)游戲,再次帶來了讓人期待已久的更新——《世界 第二部分》。這一次,開發(fā)者不單單滿足于擴(kuò)大游戲的星系范圍,更是...
02-01
RTX 5090已于1月30日在全球開賣,但因?yàn)樨浽聪∩?,?dǎo)致全球各地掀起搶購(gòu)潮。 據(jù)媒體報(bào)道,日本東京秋葉原一家名為“電腦工房秋葉原零件館”的店家限量發(fā)售10張RTX...
02-03
記者當(dāng)?shù)貢r(shí)間5日獲悉,位于美國(guó)華盛頓州的西塔科機(jī)場(chǎng)當(dāng)天10時(shí)左右發(fā)生輕微碰撞事故,一架滑行中的日本航空公司飛機(jī)撞到一架??康倪_(dá)美航空飛機(jī)尾部,碰撞未造成人員受傷。目前事...
02-06
在上海交通大學(xué)閔行校園的西區(qū),旭華路是一條幾乎貫穿南北的道路。開學(xué)時(shí)節(jié),這幾乎是全校最熱鬧的道路之一,沿旭華路一路穿行,會(huì)經(jīng)過學(xué)生宿舍、體育場(chǎng)、用餐區(qū)、快遞區(qū)、活動(dòng)場(chǎng)館...
02-08
85后女董事長(zhǎng)接班1年后,連續(xù)虧損的賽為智能要自救了?近日,賽為智能(300044.SZ)發(fā)布2024年度業(yè)績(jī)預(yù)告。預(yù)告顯示,賽為智能去年全年預(yù)計(jì)實(shí)...
01-23
1月21日,美國(guó)總統(tǒng)唐納德·特朗普宣布,美國(guó)開放人工智能研究中心(OpenAI)、軟銀和甲骨文公司將聯(lián)合成立名為“星際之門”的新公司。未來4年,這3家...
01-24
當(dāng)前正值春運(yùn)為保障廣大交通參與者平安出行遼寧省公安廳交通安全管理局針對(duì)下列8類交通安全風(fēng)險(xiǎn)較高的...
01-21
  “感覺空氣中都彌漫著節(jié)日的氣息”“下班時(shí)候經(jīng)過,真驚艷到了”……連日來,不少市民驚喜地發(fā)現(xiàn),和平區(qū)...
01-22
好消息,2025年杭州家電以舊換新和3C數(shù)碼產(chǎn)品購(gòu)新補(bǔ)貼全面啟動(dòng)!對(duì)個(gè)人消費(fèi)者直接新購(gòu)12大類家電產(chǎn)品給予15%或者20%立減補(bǔ)貼,最高補(bǔ)貼28000元。對(duì)個(gè)人消費(fèi)者購(gòu)買6000元(含)以下手...
01-21
  春節(jié)臨近  近日  廣東、河南、遼寧的  一些城市已明確  2025年可以  有序、限時(shí)或在限定區(qū)域  燃放煙花爆竹  關(guān)于煙花爆竹燃放,多地官宣  東莞  1...
01-22
1 月 29 日消息,特斯拉公司宣布,其 Cybertruck 車主現(xiàn)在可以在所有 V4 超級(jí)充電站享受更快的充電速度。此前,特斯拉于上個(gè)月開始逐步推出這一快速充電功能。1 月 28 日...
01-29
2 月 1 日消息,華為余承東發(fā)文,稱其駕駛一臺(tái)鴻蒙智行智界R7增程版,全程使用智能駕駛,成功從安徽到深圳自駕1345公里返工,算上去休息區(qū)的時(shí)間,一共用時(shí) 15 個(gè)小時(shí)。今天在...
02-02
返回

點(diǎn)擊右上角微信好友

朋友圈

點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請(qǐng)點(diǎn)擊“”按鈕

點(diǎn)擊右上角QQ

點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請(qǐng)點(diǎn)擊“”按鈕