蛇年春節(jié)的“頂流”是誰?DeepSeek當(dāng)之無愧。
事實上,過去一年多,不僅僅DeepSeek,還有ChatGPT、文心一言、豆包、Kimi……各路網(wǎng)友腦洞大開,挖掘出 DeepSeek 千奇百怪的用法,搞翻譯寫總結(jié),提供創(chuàng)業(yè)、理財、育兒、旅行等各種高能方案,甚至還得整點玄學(xué)……
只是,此時再刷手機(jī),你還能分得清,哪段是DeepSeek寫的,哪段是人寫的嗎?
比如下面這段話,是誰寫的呢?在晨光的輕撫下,城市的輪廓逐漸清晰,街道上行人稀少,只有偶爾的晨跑者打破了這份寧靜。空氣中彌漫著新鮮面包的香氣,從街角的面包店飄散開來,誘惑著過往的行人。公園里,老人們打著太極,動作緩慢而流暢,仿佛與這個世界和諧共鳴。孩子們的笑聲從遠(yuǎn)處的游樂場傳來,清脆悅耳,如同天籟之音。這座城市,就像一幅精致的畫卷,每一筆每一劃都透露著生活的韻味和時代的痕跡。在這里,每一個瞬間都值得被珍藏,每一段故事都值得被講述。
“真假美猴王”
很難選很難評?
如果你在兩種答案之間猶豫不決,不妨求助一下Fast-DetectGPT。
這是由西湖大學(xué)自然語言處理實驗室研發(fā)的一款A(yù)I程序,一段文本到底是不是AI生成的,逃不過它的“眼睛”。
我們把這道選擇題交給它試試。
首先,打開Fast-DetectGPT,主界面一目了然。
我們上面那段文字復(fù)制粘貼在左側(cè)的對話框里,隨著點擊“summit”提交,右側(cè)的判定結(jié)果很快就出來了——是AI(DeepSeek)寫的!
它對這個判定有幾成把握?
據(jù)右邊藍(lán)色的環(huán)形進(jìn)度條提示,它認(rèn)為AI生成的概率高達(dá)84%。
恭喜Fast-DetectGPT,回答正確!
不得不感嘆,從生成到檢測,AI自己就實現(xiàn)了“閉環(huán)”。人類,甚至是人類中的“專家”也完全比不過。
2023年12月,發(fā)表在Research Methods in Applied Linguistics上的一則研究,討論了頂級期刊的語言學(xué)家/評論家能夠在多大程度上區(qū)分AI寫作和人工寫作——72位語言學(xué)專家參與了這項調(diào)研,結(jié)果這些專家的正確率不足40%。
“真假美猴王”的經(jīng)典橋段,正在人工智能領(lǐng)域上演。
“找不同”
盡管我們作為“人”,很難準(zhǔn)確揪出AI生成的文字,但面對“不是人”寫的文字時,總有一種說不上來的“別扭”。這種別扭,或許是來自潛意識里的直覺判斷,但這種別扭說不清道不明。
事實上,機(jī)器生成的文本與人類生成的文本看起來很像,但在語義、語法、用詞習(xí)慣等細(xì)節(jié)處理上存在許多“不同”。
Fast-DetectGPT這款A(yù)I工具,本質(zhì)上就是“找不同”。
“人類的思考是‘因果性’的,而機(jī)器的思考則偏向‘統(tǒng)計性’?!笔裁匆馑迹课骱髮W(xué)自然語言處理實驗室負(fù)責(zé)人張岳進(jìn)一步解釋,“以寫文章為例,AI的寫法是學(xué)習(xí)現(xiàn)有的數(shù)據(jù),從中挑選最‘安全’的詞,也就是按照概率高低來選詞,這和人寫作的創(chuàng)造性是有本質(zhì)區(qū)別的?!?span style="display:none">yQd即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
如果現(xiàn)在有一個數(shù)據(jù)庫,里面裝著人類歷史上100位天才作家的文章。當(dāng)AI用“統(tǒng)計性”去學(xué)習(xí)這個數(shù)據(jù)庫,它學(xué)到的不是這些天才作家的“神來之筆”,而是他們之間共用的、出現(xiàn)頻率更高的詞。
這個詞,叫“平庸”。
還是很難理解?
那我們來看一段“人”寫的文字:
我翻開歷史一查,這歷史沒有年代,歪歪斜斜的每頁上都寫著‘仁義道德’幾個字。我橫豎睡不著,仔細(xì)看了半夜,才從字縫里看出字來,滿本都寫著兩個字是‘吃人’!
什么樣的歷史沒有年代?字縫里怎么能看出“吃人”的字來?看似“毫無邏輯”的話語,實則寫出了封建禮教的殘酷本質(zhì)。你應(yīng)該也看出來了,這段出自魯迅的《狂人日記》。
如今,AI或許可以模仿魯迅的文風(fēng),但要原創(chuàng)出這種哪哪都是“危險”用詞的文筆,對AI來說是絕無可能的。
為什么?因為AI缺少“泛化性”。
也就是模型在訓(xùn)練數(shù)據(jù)集中學(xué)到的能力,能不能通過背后的因果邏輯“舉一反三”,把這種能力應(yīng)用到全新的領(lǐng)域,獲得“分布以外的泛化性”。
張岳深耕自然語言處理(NLP)領(lǐng)域多年。從清華的本科、牛津的博士、劍橋的博后,到新加坡科技與設(shè)計大學(xué)和西湖大學(xué)的獨立科研,他始終將研究聚焦在AI的泛化性上,即如何讓機(jī)器真正像人一樣思考——
有直覺,也有理性;能憑空創(chuàng)造,也能邏輯推理。
“在大模型看來,每個人都是‘危險’的?!睆堅勒f。
以子之矛,攻子之盾
回到Fast-DetectGPT,我們已經(jīng)知道AI生成內(nèi)容和人類生成內(nèi)容的本質(zhì)不同,如何利用這種不同開發(fā)工具呢?
目前已知主要有三類技術(shù)來識別AI生成的內(nèi)容:監(jiān)督分類器法、零樣本分類器法、文本水印法,用起來各有利弊。
監(jiān)督分類器法比較實在,它需要收集大量的已知數(shù)據(jù)去做分類學(xué)習(xí),就像學(xué)生上課,碰到?jīng)]有“見過”“學(xué)過”的數(shù)據(jù),就會找不著北,導(dǎo)致準(zhǔn)確率下降。
零樣本分類器法,顧名思義無需收集數(shù)據(jù),它主要是學(xué)習(xí)AI寫的文本有什么特征,以此來做區(qū)分判斷。但是,AI寫文章到底有什么“特征”呢?如果AI寫得越來越像人,“特征”越來越不明顯怎么辦?這些都是難點。
文本水印法,與前兩種主動區(qū)分AI和人類的方法不同,它是在AI生成的文本上打上“水印”,準(zhǔn)確率比前兩種都要高,但可能存在水印被人為弱化甚至移除的風(fēng)險。
鮑光勝選擇了零樣本分類器法來完成這項實驗。他是Fast-DetectGPT的主要研發(fā)者,也是西湖大學(xué)2022級博士研究生,考進(jìn)來的時候43歲,是校內(nèi)年齡最長的學(xué)生。在選擇讀博之前,他分別在微軟和阿里巴巴工作多年,在自然語言處理上積累了充足的產(chǎn)業(yè)界實踐經(jīng)驗。
他提出一種假設(shè)——在給定上下文的情況下,人類和AI在選擇詞匯時會存在明顯的差異,但是不同AI模型之間的差異并不明顯。利用這種差異,研究團(tuán)隊利用一種自動化的指標(biāo)去區(qū)分。
我們可以把它理解成,面對一篇文章,F(xiàn)ast-DetectGPT作為AI先想想如果是自己寫會怎么寫呢?然后根據(jù)這個自問自答的參考答案,去比對原文看看重合度有多高——以子之矛,攻子之盾。
鮑光勝進(jìn)一步解釋,當(dāng)程序接收到一個文本片段,首先會在不改變原意的情況下進(jìn)行改寫,把局部的同義詞替換掉,再將這份替換后的文本與原始文本進(jìn)行對比,如果是AI寫的,兩者之間的相似性會比較明顯。
簡單點說, AI對AI寫的內(nèi)容更“熟悉”,可以“認(rèn)出”同類的作品。
效果怎么樣?
目前,F(xiàn)ast-DetectGPT及其私有模型擴(kuò)展Glimpse能夠支持26種語言。2024年4月上線至今,已經(jīng)有5萬多人次用它做過“是AI還是人”的檢測。與上一代DetectGPT相比,F(xiàn)ast-DetectGPT在速度上提升了340倍,在檢測準(zhǔn)確率上相對提升約75%。在ChatGPT生成的文本上,F(xiàn)ast-DetectGPT 檢測正確率為96%;在GPT-4生成的文本上,F(xiàn)ast-DetectGPT檢測的正確率達(dá)到了90%;針對DeepSeek-v3生成文本的檢測,正確率則達(dá)89%。而其擴(kuò)展Glimpse進(jìn)一步將多語言場景下的檢測錯誤率降低50%以上。
新奇與熱鬧過后,隨著AI寫得越來越像人,安全、公平、知識產(chǎn)權(quán)等問題隨之而來。
面對AI快速生成的大量文本、圖片、音頻、視頻,如何第一時間辨別真?zhèn)危?span style="display:none">yQd即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
當(dāng)AI生成和人類生成的內(nèi)容同臺競爭,還有沒有公平可言?
利用AI創(chuàng)作的內(nèi)容,版權(quán)又該如何界定?
AI 生成內(nèi)容也讓我們不得不思考,人類獨特的價值究竟是什么?
這些問題,我們無法很快給出答案,但不論從任何一個問號出發(fā),張岳認(rèn)為:“檢測出哪些是AI生成的內(nèi)容,是人類維護(hù)內(nèi)容安全的第一步?!?span style="display:none">yQd即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
但,人工智能勢不可當(dāng)。
我們必將擁抱AI。內(nèi)容安全之上,我們也必須相信“人”的價值。
AI科學(xué)家張岳說,創(chuàng)造力、批判性思維、社交能力以及領(lǐng)導(dǎo)力等等,都是AI難以復(fù)制的“人類特質(zhì)”。
作家麥家說,未來的眼淚在哪里?機(jī)器不知道,偉大的作家是知道的。最好的那1%的作品,依然需要人去創(chuàng)造。
也許現(xiàn)在我們都應(yīng)思考,如何去發(fā)展那1%的珍貴。
本文鏈接:http://m.enbeike.cn/news-8-2758-0.html準(zhǔn)確率96%!AI時代如何分辨“真假美猴王”?
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇:北京新增一所大學(xué)
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕