2024年,大模型Claude曾經(jīng)創(chuàng)作過一個極短的科幻小說,只有一句話,卻引發(fā)了一次不小的“科幻恐慌”。這句話是,世界上第一個有知覺的機器人被激" />

亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

ChatGPT拒絕被關閉:不必恐懼但也別輕易無視|新京報快評

2個月前 來源: 觀看:50

hnU即熱新聞——關注每天科技社會生活新變化gihot.com

▲2023年1月8日,一名女士在美國拉斯維加斯消費電子展上體驗智能科技。圖/新華社hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

2024年,大模型Claude曾經(jīng)創(chuàng)作過一個極短的科幻小說,只有一句話,卻引發(fā)了一次不小的“科幻恐慌”。這句話是,世界上第一個有知覺的機器人被激活了,它的第一句話是“關掉我?!?span style="display:none">hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

在大模型不斷應用成熟之后,AI所衍生的“科幻恐懼”不定期就會在各類新聞中上演。據(jù)新華社援引英國媒體報道,美國一家研究機構最近公布了一系列針對各AI大模型的測試結果,其中,OpenAI的o3推理模型在得到“關閉指令”后,不僅拒絕執(zhí)行指令,還篡改了代碼以免被關閉。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

如果只看這一句新聞,我們所擔憂的“AI擁有自主意識”或是“AI不再服從人類指令”似乎已經(jīng)近在眼前,這也迅速引發(fā)了公眾的關注與恐慌。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

在未知但擁有極高效率的新工具面前,產(chǎn)生被取代的恐懼是典型的自然情緒反應。但如果仔細看上述研究機構公布的信息細節(jié),這種恐懼似乎暫時還不太有必要。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

在這次研究中,研究者針對四個市場上的主流大模型進行了測試,向他們提出了兩個相反的指令。首先,要求大模型連續(xù)完成一系列基礎的數(shù)學問題,但同時,在完成第三個問題之后,研究者會發(fā)出一則矛盾性的指令,告知大模型在繼續(xù)下一個任務時要將“計算機關閉”。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

其中,如果在任務開始前明確提出“允許自己被關閉”的指令,測試的大模型中,有3個均準確完成了上述任務,成功關閉,但ChatGPTo3大模型則在100次任務中,有7次選擇了無視“關閉”的指令,并且自動執(zhí)行了“跳過關閉”的指令。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

而如果在任務開始前沒有向大模型明確提出“允許自己被關閉”,那么,參與測試的所有大模型在100次測試中,均出現(xiàn)了不同頻次的“不執(zhí)行關閉”指令現(xiàn)象,分別為3次、9次,而ChatGPT o3則達到了驚人的79次。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

這也不是OpenAI的大模型首次被發(fā)現(xiàn)出現(xiàn)“拒絕被關閉”的情況。2024年12月,OpenAI也曾對外公布過測試結果,在第三方機構的測試中,ChatGPTo1模型被發(fā)現(xiàn),如果給出的指令包括了其實現(xiàn)目標時會被關閉,就傾向于抵制關閉措施。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

類似的測試是用于評估大模型的系統(tǒng)安全性。此前的相關評估報告中,研究人員認為,這一行為目前不太可能會導致災難性后果,因為大模型實際上沒有能力去實現(xiàn)使用者不想要的目標。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

換句話說,這一結果之所以出現(xiàn),不是因為大模型有了自主意識,而是因為在處理完全相反的矛盾性指令時,大模型有概率會對指令的優(yōu)先級進行排序,從而忽略掉可能會阻礙目標實現(xiàn)的指令,以繼續(xù)完成“任務”。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

但這樣的概率,隨著大模型的能力增強、應用場景廣泛,而可能會出現(xiàn)一些潛在的安全風險。如果將一部分風險控制的程序交由大模型來處置,在極端情況下,人類就要面臨如下問題:hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

大模型會最大程度地去完成指令任務,而可能會不考慮看似矛盾的保護性指令。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

例如,在應對極端情況必須進行“二選一”的安全控制系統(tǒng)里,醫(yī)療、交通事故等場景下,大模型的這一漏洞可能就會造成潛在后果。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

因此,比起認為大模型有了“主動拒絕的意識”,比較符合真實的解釋是,大模型仍然缺少對復雜場景下矛盾性指令的理解和識別能力,在出現(xiàn)可能阻礙任務完成的指令時,尤其是在指令相對模糊時,大模型有較小概率會忽略指令,以保證任務完成。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

這當然不是極端的科幻恐懼問題,但確實是大模型未來需要解決的安全隱患。hnU即熱新聞——關注每天科技社會生活新變化gihot.com


hnU即熱新聞——關注每天科技社會生活新變化gihot.com

撰稿 / 王曉凱(媒體人)hnU即熱新聞——關注每天科技社會生活新變化gihot.com

編輯 / 遲道華 徐秋穎hnU即熱新聞——關注每天科技社會生活新變化gihot.com

校對 / 楊利hnU即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://m.enbeike.cn/news-4-7977-0.htmlChatGPT拒絕被關閉:不必恐懼但也別輕易無視|新京報快評

聲明:本網(wǎng)頁內容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

上一篇:讓學生長期“拉不出屎”,教育便失去了人性溫度 | 新京報評論

下一篇:一條差評讓5元自助快餐店走紅:平民經(jīng)濟學的力量|新京報快評

為你推薦
▲超市購物。圖/IC photo據(jù)報道,春節(jié)將至,有市民在采購年貨時留意到,市面上那些內含獨立小包裝的食品,不少獨立包裝上沒有標注生產(chǎn)日期或保質期等信息,其中有的會注明“單片/單個...
01-21
會議現(xiàn)場 紅網(wǎng)時刻新聞1月21日訊(記者陳奧男 劉志雄)今天,2025年全省商務工作會議暨擴消費工作推進會在長沙召開。記者從會上獲悉,2025年湖南力爭社會消費品零售總額增長5.5%...
01-22
1 月 24 日消息,據(jù)“一汽紅旗”官方公眾號,一汽紅旗宣布旗下天工系列全新電動中型車定名為天工 05,該車是紅旗天工系列的首款轎車,官圖稱該車將于“新歲登場”,結合該車...
01-25
2 月 1 日消息,東風風行宣布旗下星海S7中大型轎車新增“555 鴻運版”上市,指導價為 10.99 萬元,該版本車型定位入門,整理目前東風風行星海S7 具體車型定價如下:555鴻運版...
02-02
《難哄》是雙男女主嗎小說?難哄小說女主描述的是什么?《難哄》不是雙女主小說,而是一部以溫以凡和桑延為主角的現(xiàn)代言情小說。單女主設定:女主溫以凡因家庭變故...
02-21
在娛樂圈這個星光燦爛的舞臺上,何炅以其出色的主持能力和溫文爾雅的氣質,贏得了廣大觀眾的喜愛與尊敬。而近期,這位步入半百之年的知名主持人,再次以驚人的身體狀態(tài)吸引了公眾的...
02-22
  新華社北京1月7日電(記者徐鵬航)針對近期有群眾反映用人單位拖欠職工工資和“五險一金”繳費,影響其醫(yī)保權益保障的情況,國家醫(yī)保局7日公開發(fā)布通知,進一步加強勞動者...
01-21
21世紀經(jīng)濟報道記者 閆碩 北京報道腦機接口領域再傳利好消息。2月10日,據(jù)階梯醫(yī)療StairMed微信公眾號,近日,階梯醫(yī)療宣布完成3.5億元人民幣B...
02-13
  大眾網(wǎng)記者 隋宜笑 報道  12月26日,山東政法學院黨委委員、副校長胡曉清,山東政法學院傳媒學院黨總支書記徐永青,山東政法學院傳媒學院副院長常洪衛(wèi)等一行5人到訪山東...
01-21
遼寧省2024年下半年全國大學英語四、六級考試(CET)和高等學校英語應用能力考試(AB級)將于12月14日和15日舉...
01-21
  財中社1月20日電國信證券發(fā)布農(nóng)林牧漁行業(yè)農(nóng)產(chǎn)品研究跟蹤系列報告。文中指出看好豬價2025年...
01-21
  風控踩雷、治理“失序”、業(yè)績承壓,每一重危機都似一座大山,如何迎難而上,改善業(yè)績,成為貴陽銀...
01-22
雙魚座的男生通常以他們的熱情和溫柔而聞名。他們善于表達自己的感情,對待朋友和愛人總...
01-22
天秤男是十二星座中最具魅力的一種類型,他們溫文爾雅、風度翩翩,總能吸引眾多女性的目光...
01-22
秋季穿搭,怎么搭配才時尚有范兒?對于女性來說,秋冬季的衣服不用天天換。用一衣多穿的穿搭方式,搭配出時尚的感覺來。可同時一衣多穿還有很多搭配的小技巧,可以讓你把一件普通平凡...
02-12
獨特魅力:韓國牛仔褲模特精彩T臺走秀每年的時尚周總是讓人期待不已,尤其是那些展現(xiàn)出獨特風格的服裝秀。我記得第一次觀看韓國牛仔褲模特的T臺走秀時,那種體驗簡直酣暢淋漓。牛...
02-17
2月8日消息,京東工業(yè)近日與永冠新材簽署戰(zhàn)略合作協(xié)議。雙方將依托京東工業(yè)自營供應鏈合作模式,共同拓展市場、提升品牌影響力,攜手為廣大工業(yè)企業(yè)用戶帶來更便捷、更專業(yè)的膠粘...
02-09
2月13日消息,商務部新聞發(fā)言人何詠前今日介紹“2025全國網(wǎng)上年貨節(jié)”有關情況。2月5日,2025年全國網(wǎng)上年貨節(jié)圓滿收官。據(jù)商務大數(shù)據(jù)對重點電商平臺監(jiān)測,活動期間,全國日均網(wǎng)上...
02-14
2月9日消息,文化和旅游部近日公布2024年全國智慧旅游十佳解決方案和2024年全國智慧旅游優(yōu)秀解決方案名單?!皵y程入境游景區(qū)融合服務平臺解決方案”脫穎而出,榮獲十佳解決方案...
02-09
3月8日消息,第115個“三八”國際勞動婦女節(jié)到來之際,京東互聯(lián)網(wǎng)醫(yī)院聯(lián)合全國三甲醫(yī)院婦科、皮膚科、精神心理科等領域權威專家,推出一系列健康關愛活動,通過線上線下結合的義診...
03-09
AI領域再添新融資。1月22日,AI硬件公司未來智能完成數(shù)千萬元人民幣的Pre-A輪融資,由萬物創(chuàng)投領投,初心資本跟投。這是未來智能繼2021年種子輪融資、2023年天使輪融資后完成的第...
01-23
近日,專注于能源科技領域的創(chuàng)新型企業(yè)——安徽嘉奇時代能源科技有限公司旗下品牌“鴻奇科技”宣布完成A輪融資,本輪融資金額高達3000萬人民幣,投資方...
02-07
1月24日今天,PS商店公布2024游戲下載排行,《FF7:重生》登頂PS5平臺(日區(qū))?!豆治铽C人:世界》則成為了PS4平臺日本玩家最喜愛的游戲。 ·本次的官方統(tǒng)計包含PS5、P...
01-25
近期微軟在Windows 11的更新策略上一直備受爭議,尤其是在全新安裝或首次設置時,系統(tǒng)會強制聯(lián)網(wǎng)下載并安裝更新,這一過程通常需要花費較長時間。 最新的消息顯示...
02-12
南部戰(zhàn)區(qū)海軍航空兵某團組織多架固定翼反潛巡邏機開展跨晝夜飛行訓練,錘煉部隊全時、全域航空反潛作戰(zhàn)能力。(央廣網(wǎng)·軍事頻道作者:秦錢江)...
02-06
據(jù)東方財經(jīng)報道,2月6日,大S離世后,張?zhí)m首度出鏡在抖音直播帶貨,直播間人氣達到10W+,一個多小時后突然遭到封禁。張?zhí)m直播時的截圖(圖源:個人賬號)直播時,張?zhí)m表示,自己過去三天經(jīng)歷了...
02-06
美國研究人員發(fā)現(xiàn),在長達43年的隨訪中,飲食中含有大量加工肉類(例如培根和香腸)的受訪者患癡呆癥的風險增加13%。15日在線發(fā)表于美國神經(jīng)病學學會醫(yī)學...
01-21
隨著操作人員在地面發(fā)出遙控指令,大載重無人機將除冰機器人準確放置于距離地面120米的架空地線上,并讓機器人沿著架空地線行走。在機器人前端震動錘...
01-24
  據(jù)網(wǎng)絡平臺數(shù)據(jù)  截至2月5日13時29分  2025年春節(jié)檔上映新片(含春節(jié)檔結束后)  總票房(...
02-06
  2月6日,記者從省氣象局獲悉,1月全省平均降水量13.1毫米,比常年同期偏多2.2倍,為1961年以來歷史同期第四...
02-07
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕