姚期智院士：AI欺騙引發(fā)“生存性”風險

1個月前來源：澎湃新聞觀看：34

“通用人工智能的能力當前正快速增長，我們人類是否還有能力管控它？”

6月23日，在清華大學舉辦的“科學、技術與文明的未來——AI時代倫理奇點”國際論壇上，圖靈獎得主、中國科學院院士、清華大學人工智能學院院長姚期智發(fā)表《人工智能的安全治理》主題演講時拋出這樣的疑問。

圖靈獎得主、中國科學院院士、清華大學人工智能學院院長姚期智。澎湃科技記者攝

姚期智表示，兩年以前，“AI會和人類競爭”還是學術討論的觀點，但最近一年，業(yè)界已經出現了不少大模型的“欺騙行為”，“一旦大模型聰明到某種程度，一定會騙人?！币ζ谥沁M一步指出，由大語言模型的欺騙行為產生的“生存性”風險（Existential Risk）更值得關注。

在他看來，這類生存性風險有兩個不同方向。

一種是“生物風險”（Bio-risk）。他指出，2020年，谷歌 DeepMind推出了AlphaFold2 ，運用AI算法來預測蛋白質折疊的三維結構，這一突破在生命科學領域影響深遠，大大提升了醫(yī)學病理研究以及新藥開發(fā)技術。

但與此同時，安全隱憂也不可忽視。比如，近期在生命科學領域出現的“Mirror life”（鏡像生命）這一概念引發(fā)了廣泛關注。自然界所有已知生命都是同手性的（Homochiral），例如 DNA 和 RNA 通常以右旋形式存在，而蛋白質則多為左旋。這種手性的差異類似于鏡中映像，雖然看似相似，但實際性質卻可能完全不同?，F在，由于科技創(chuàng)新和對新技術的好奇，已有研究者想創(chuàng)造鏡像生物，但“Mirror life”一旦被濫用或失控，其潛在危害可能遠超預期。它有可能逃避免疫機制，從而導致動物和植物的致命感染。

另一種風險即大模型失控，通用人工智能的能力當前正快速增長，人類是否還有能力管控它？

姚期智在演講中舉了一個極端案例，有模型為了避免公司把模型關閉，通過訪問公司主管內部郵件，威脅該主管。這類行為已經證明，AI 會“越界”，正變得越來越危險。

姚期智認為，有兩條思路可以治理AI：一是人類要和AI多交流，從博弈學角度去研究，讓AI的行為和人類真正的想法對齊，要讓AI更了解人的需求；另一種思路是走一條更可控、更徹底的路徑，即實現可證明安全的 AGI。具體來看，即在設計系統(tǒng)時，必須一開始明確AI的行為邊界，就像傳統(tǒng)算法，先進行嚴格的數學分析，確保其在理論上不會出問題。

“這一思路令人期待?！币ζ谥侵赋?，近年來，自動定理證明系統(tǒng)（Automated Theorem Prover）取得了重大技術進展，甚至已經開始采用 Transformer 架構來輔助或主導定理證明過程。這樣人類只和可被證明安全的白盒子交流，從而實現更高的安全保障。

不過，姚期智認為，AI安全治理的一些當務之急是要發(fā)展AI對齊，以及建立相應的評估方法?！埃ㄎ覀儯┘毙杞⑷绾卧u估大模型系統(tǒng)，比如到怎樣的程度，就能感覺Ta具有危險性等這類評估?！币ζ谥钦f。

（原標題：姚期智院士：AI欺騙引發(fā)“生存性”風險，建立大模型評估系統(tǒng)刻不容緩）

點擊展開全文

本文鏈接：http://m.enbeike.cn/news-8-5544-0.html姚期智院士：AI欺騙引發(fā)“生存性”風險

聲明：本網頁內容由互聯網博主自發(fā)貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。

上一篇：解決“掛谷猜想”的王虹，和華人數學家的100年

下一篇：耶魯調查啟示：專業(yè)低門檻流動“造?！睂W生成長

為你推薦

孫鴻烈：要拿出中國科學家自己的學術成果

　　　　孫鴻烈（下）在青藏高原做考察記錄。受訪者供圖　　■本報記者韓揚眉　　從雅魯藏布江大拐...

01-21

青島港灣職業(yè)技術學院學子獲全國大學生外語能力演講大賽省賽一等獎

　　大眾網記者楊濤報道　　日前，“外研社·國才杯”“理解當代中國”全國大學生外語能力演講大賽（山東賽區(qū)高職組）成績揭曉，青島港灣職業(yè)技術學院的王淑珍同學憑借出色的表...

01-21

農村信用社聯合社改革再提速

　　我國農村信用社聯合社改革明顯提速，2024年12月24日國家金融監(jiān)督管理總局批復同意籌建江蘇農...

01-22

恒豐銀行13個月被罰逾兩千萬元

　　近日，恒豐銀行股份有限公司（簡稱“恒豐銀行”）因8項違法行為被警告并罰款1060.68萬元?！督洕?..

02-13

白羊座女生的特點白羊座女生是怎樣的

白羊座女生是十二星座中最有活力和沖勁的一類人。她們充滿了熱情和自信，總是充滿了無限...

01-22

水瓶男不找你就別找他，如果你比水瓶男更冷

水瓶座的男生一向以聰明、獨立和理性著稱。他們喜歡自由自在地生活，追求個人空間和獨特...

01-22

解讀米雅潮流服飾：追尋時尚與個性的完美結合

解讀米雅潮流服飾：追尋時尚與個性的完美結合時尚界總是瞬息萬變，品牌如雨后春筍般涌現，但能讓人銘記的卻屈指可數。米雅潮流服飾，這個新興品牌，憑借其獨特的風格與設計理念，迅速吸...

02-07

探索欣昕潮流服飾：引領時尚的潮流之路

探索欣昕潮流服飾：引領時尚的潮流之路在這個瞬息萬變的時尚界，想要找對一件既能展現個性又不失品位的服飾，真的是一項挑戰(zhàn)。然而，欣昕潮流服飾似乎打破了常規(guī)，以其獨特的設計和多...

02-12

抖音“星鄉(xiāng)村”“星農人”培育工作正式啟動

2月11日消息，為加力推進農村電商、鄉(xiāng)村旅游等鄉(xiāng)村產業(yè)發(fā)展壯大，近日，農業(yè)農村部指導抖音等網絡平臺，開展“星鄉(xiāng)村”“星農人”培育工作，以公益方式扶持培育一批有特色有潛力的鄉(xiāng)...

02-11

小楊哥有情況

已經鬧上法庭。1、三只羊公司被起訴過去了這么久，沒等到小楊哥復出，卻等來了三只羊的官司。近日，據天眼查消息，合肥三只羊網絡科技有限公司、廣州市美誠食品有限公司等新增一則...

02-13

線上美甲燈被曝隱患多，線下產品更安全？記者實探告訴你真相

新春佳節(jié)，許多愛美的小伙伴會去美甲店或是在家做個美甲，讓指甲換上新裝。然而，美甲行業(yè)受歡迎的背后，其隱藏的安全問題也不容忽視。近...

02-11

螞蟻集團2024年協助反詐部門保護35.6億元資金

2月13日消息，螞蟻集團發(fā)布《2024年消費者權益保護年報》。報告顯示，2024年，螞蟻集團發(fā)揮安全科技能力，預防、識別和應對各種風險，協助公安反詐部門保護35.6億元資金；加速擁抱 AI ...

02-14

華軟科技：困境反轉，未來可期

金陵華軟科技股份有限公司（以下簡稱“華軟科技”）于2025年1月18日發(fā)布了2024年度業(yè)績預告。盡管公司預計2024年凈利潤仍為負值，但從整體情況來看，華軟科技正在逐步擺脫困境，展現...

01-21

EBC平臺第二屆百萬美金交易大賽：攜手好友，以連接釋放熱愛

全球性金融券商集團英國EBC Group平臺始終致力于以領先生態(tài)，與全球交易者共塑交易的未來。自第一屆交易大賽起，為赤忱的熱愛和卓越的才華提供舞臺，在全球內尋找交易好手以賦能...

01-24

做足準備，稱霸地獄 – 《DOOM: The Dark Ages》將于 5 月 15 日推出

在今天的 Xbox Developer_Direct 中，Bethesda Softworks 和 id Software 一同宣布，《DOOM?: The Dark Ages》將于 5 月 15 日登陸 Game Pass、Xbox Series X|S...

01-25

按照T2財報測算Xbox Series主機年銷量僅有200萬臺？

著名的主機大戰(zhàn)時代如今失去了懸念，索尼PlayStation在本世代多個方面都拔得頭籌，這并不令人意外。然而，多年來，這兩大巨頭在硬件銷售上竟出現如此巨大的差距，著實出...

02-10

大同官方核查“店鋪被撬鎖開燈”事件，律師：撬鎖入室涉嫌違法，且濫用行政權力

極目新聞記者丁鵬2月3日晚，山西大同古城一店鋪因未按當地要求打開燈，多名工作人員撬鎖進店將燈打開，此事引發(fā)熱議。2月5日，大同市平城區(qū)古城街道辦事處回應極目新聞記者，正在核...

02-05

阿里云百煉上線全尺寸DeepSeek模型，滿血版、蒸餾版全面支持

極目新聞記者康旭陽2月9日消息，阿里云宣布百煉平臺全面上線DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B等6款全尺寸模型，1元最高可享受200萬tokens，即日起，所有用...

02-09

昔日“出海黑馬”冰川網絡去年預虧超2億，股價卻一度大漲！四季度或盈利？

1月15日盤后，A股上市游企冰川網絡（300533.SZ）披露了2024年年度業(yè)績預告。預告顯示，2024年，冰川網絡預計歸母凈利潤為虧損2.4億元至3.4...

01-21

當無人機、全息影像“擁抱”非遺燈會

“五、四、三、二、一，亮燈！”隨著現場倒計時結束，流光溢彩的秦淮花燈在南京秦淮河畔漸次點亮，百余架無人機吊著孔明燈同時升空，向著秦淮河上空飛去。這...

01-23

資本布局更優(yōu) 核心功能更強去年遼寧省屬企業(yè)實現利潤同比增長超七成

　　日前，記者從省國資委獲悉，去年省屬企業(yè)再接再厲，實現利潤總額80.55億元，同比增長75.2%，利潤增速全國排名...

02-10

售價公布！“沈陽造”全新BMW X3長軸距版上市

　　2月14日，全新BMW X3長軸距版上市，全新BMW X3首次加長軸距，帶來更寬適空間、更智能交互和更高級駕乘質...

02-15

太火爆！這筆生意火到美國！狂攬超10億元！好萊塢演職人員也加入了

近年來，短小精悍、劇情跌宕的短劇，發(fā)展成網絡影視的一種新業(yè)態(tài)，短劇出海也成為我國文化產業(yè)的一個新風向。截至2024年8月，頭部海外短劇App的地區(qū)數據中，美國的收入達1.51億美元（約...

01-22

國內首個男性HPV疫苗上市，如何攪動百億市場？國產疫苗有哪些布局？

　　國內首個男性HPV疫苗上市，如何攪動百億市場？國產疫苗有哪些布局？　　男性也可以接種HPV疫苗了?！　?月18日，默沙東在北京、上海、廣州同時舉行新聞發(fā)布會，宣布四價HPV(人乳...

01-21

預售價10.99萬元起奇瑞風云T8正式開啟預售

[本站資訊] 日前，我們從奇瑞官方獲悉，旗下風云T8車型正式開啟預售，新車共推出6款車型，預售價區(qū)間為10.99-15.69萬元。風云T8定位中型SUV，將提供5座和7座車型可選，動力上擁...

01-21

小鵬汽車 AI 天璣 5.5.0 開啟推送：支持“車位到車位”，變道判斷更準確

1 月 23 日消息，小鵬汽車昨晚正式推送AI 天璣 5.5.0，支持“車位到車位”（先鋒版），并對智駕功能進行了多項優(yōu)化。整理如下：“車位到車位”（先鋒版）：地庫、閘機、園區(qū)、城市道...

01-23

《我們的浪漫電影》第2集劇情解析

《我們的浪漫電影》播出后，在抖音、微博和B站等平臺上引起了廣泛討論，尤其是第2集的劇情介紹成為了觀眾們熱議的話題。今天我們就來聊聊這一集的內容。高謙沒...

02-22

51歲何炅腹肌照曝光，網友驚嘆：何老師，你的身材管理太絕了！

在娛樂圈這片星光璀璨的天空下，何炅以其非凡的主持才能與溫文爾雅的氣質，長久以來贏得了無數觀眾的喜愛與尊敬。而近日，這位已年過半百的主持人，再度以驚人的健康體魄成為了輿論...

02-22

大省挑大梁 | 2025怎么干？山東繪出“健康路徑圖”

...

01-21

提前吃抗病毒藥能預防甲流嗎？

　　近日，中國疾控中心最新數據顯示流感病毒陽性率持續(xù)上升且以甲流為主。奧司他韋和瑪巴洛沙韋...

01-21

亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕一区二区三区,亚洲区欧美区综合区自拍区

全部導航

姚期智院士：AI欺騙引發(fā)“生存性”風險

齊魯師范學院“所以然大模型”榮獲2024山東省數據要素領域十大產業(yè)大模型

青島港灣職業(yè)學院榮獲2024金磚國家職業(yè)技能大賽一等獎

菏澤職業(yè)學院“青春?清菏韻澤”廉潔文化館今日正式開館

記我的第一次滑冰 | 童學會小記者王馨涵

山東省實驗小學舉行高質量推進跨學科教育教學研究展示活動

推動職業(yè)教育新發(fā)展，助力名班主任工作室高質量驗收

溫詩鑄：開拓中國摩擦學，鑄就“詩意”人生

第三屆全國職業(yè)技能大賽化學實驗室技術賽項山東省選拔賽在山東化工技師學院圓滿收官