臨近畢業(yè),為了論文達到AI率標準,有一批大學生不得不狠狠修改論文。
對于一些高校的應屆畢業(yè)生而言,除了傳統(tǒng)的查重、盲審、答辯,畢業(yè)路上又多了一道關卡——AIGC檢測。
收到學校對畢業(yè)論文進行AIGC檢測的通知,大四學生一帆對“用AI查AI”的方式感到不放心。而檢測結(jié)果讓他驚訝:“雖然我自己寫的幾個段落被誤判為99%AI,但沒想到我用AI潤色的部分也被查出來了”。
利用系統(tǒng)改寫后,他產(chǎn)生了好奇:“降AI也是AI寫的,為什么就查不出來?”查看修改內(nèi)容后,他發(fā)現(xiàn)“系統(tǒng)降AI方法就是刪掉邏輯詞、把很多話的表述變成口水話”。
對于AI率降低后的論文,他認為“論文質(zhì)量反而下降了,但為了合格,只能這樣改?!?span style="display:none">M9d即熱新聞——關注每天科技社會生活新變化gihot.com
AI 檢測再“升級”,不僅判 AI 率還能判論文質(zhì)量?
論文“AI味”漸濃,是全球高校共同面對的新難題。
第三方機構(gòu)麥可思在2024年對3000多名中國高校師生進行的問卷調(diào)查顯示,近三成大學生將AI用于論文或作業(yè)寫作。
2025年Open AI發(fā)布的報告顯示,“美國三分之一以上的大學生使用ChatGPT,他們發(fā)送的約四分之一的消息與學習和學校作業(yè)相關”,內(nèi)容涵蓋構(gòu)思論文框架、尋找主題和拓展觀點等。
2024年初,福州大學、中國傳媒大學等高校陸續(xù)發(fā)布了畢業(yè)論文(設計)AIGC 檢測的通知。相比2024年,今年有更多高校將AIGC檢測列入了畢業(yè)論文評價體系。西南大學、浙江科技大學、西南交通大學紛紛頒布關于2025屆本科畢業(yè)論文(設計)AIGC檢測的通知。
部分去年已采納AIGC檢測的高校則在今年提出了更細致的規(guī)定。以福州大學為例,去年的要求是“AIGC檢測結(jié)果將作為學生畢業(yè)設計(論文)成績評定和校級優(yōu)秀本科生畢業(yè)設計(論文)評選參考依據(jù)”。到今年,校方指導文件明確指出“AIGC全文檢測值應≤20%”,并規(guī)定終稿環(huán)節(jié)“查重檢測或AIGC檢測第二次才通過的論文最終總評成績只能記作及格”。
在檢測AI率的基礎上,一些高校進一步采用了AI智評系統(tǒng),用以評判論文質(zhì)量。有別于拿AI率作為優(yōu)秀論文參考依據(jù),廣東海洋大學、上海海事大學、溫州理工學院等高校采用AI智評系統(tǒng)對本科畢業(yè)論文進行評級,結(jié)果包含四個等級:A(良好論文)、B(合格論文)、C(建議修改)、D(高危論文)。
這些評級意味著什么?不同的高校有著不同的標準,構(gòu)成了難度不一的畢業(yè)門檻。網(wǎng)友@可回收分享自己查重定稿后,論文卻被智評系統(tǒng)評為C級,她的學校要求論文達到B級才能答辯。網(wǎng)友@一往無前和網(wǎng)友@lady luck則表示自己的學校要求C級即可達標。
根據(jù)校方指導文件,一些高校要求學生依據(jù)AI評估的結(jié)果對論文進一步修改。比如,廣東海洋大學要求盲審前,“AI智評結(jié)果為C或D以及檢測智能生成內(nèi)容比例超過40%的論文,應予以修改完善”。江蘇大學則將AI 論文質(zhì)量評估系統(tǒng)給出的數(shù)值列入了檢測標準,要求評估數(shù)值“原則上預估合格概率要高于 75%;低于 75%的,需做進一步優(yōu)化和修改”。
又貴又不穩(wěn)定,大學生被AIGC檢測困擾
“查了兩次AI率,花了140塊,太貴了。”考慮到一旦利用學校免費的查詢次數(shù),論文會被計入系統(tǒng)成為定稿,應屆生立君將論文在其他平臺進行了檢測,確保AI率穩(wěn)定,“一般大家都會提前自費查好,我們不敢把學校的檢測次數(shù)當作試錯”。
區(qū)別于論文查重精確到重合的語句標識,AIGC檢測以片段為單位,這意味著修改范圍擴大和不確定性增加。而面對被系統(tǒng)識別為“疑似AI生成”的專業(yè)術(shù)語和著作原文,不少大學生感到困惑。
網(wǎng)友@小狐貍在人間種花分享了自己的畢業(yè)論文檢測記錄,在正文一字未改、僅添加了參考文獻表和封面的情況下,間隔兩小時后的AI特征值從27.2%驟降為0.5%。對于花了兩百塊錢得到的這一波動檢測結(jié)果,她感到無奈:“現(xiàn)在花錢查的結(jié)果也不敢相信了,好怕學校查重不過”。
評論區(qū)里,大學生們傾訴著類似的苦惱,獲得高贊的網(wǎng)友@來一口貓鈞嘛評論稱“很多自己寫的都會被判定AI,我的摘要寫不好,最后是老師給我寫的,也被判為中度AI了”;網(wǎng)友@圓鏡表示“我連引用的北大核心參考文獻都被說是AI”。
“AI率降低后,我的論文卻變味了”
目前高校采用的主流檢測系統(tǒng)在2024到2025年間先后更新。維普于2025年2月26日完成AIGC檢測更新,表示其“增強了對最新AI模型的檢測效果”;知網(wǎng)個人查重服務系統(tǒng)于2025年2月13日進行了AIGC檢測服務升級;格子達在2025年3月6日發(fā)布了AIGC檢測3.0版本。
為了探究系統(tǒng)升級是否有效,澎湃新聞記者將去年《換個平臺就相差 32%,AI 論文檢測成玄學》用于AIGC檢測的同一篇“完全由AI生成”的論文投入相同的高校常用檢測系統(tǒng)進行了檢測。從結(jié)果來看,部分網(wǎng)站識別“完全由AI生成文本”的能力有所上升,但不同網(wǎng)站的差異仍然明顯。
“我用AI幫我翻譯的英文摘要都被識別出來了”。因此,電子科學與技術(shù)專業(yè)的晨夕認為,檢測系統(tǒng)對于AI生成內(nèi)容的判斷還是準確的。但對于AI檢測帶來論文邏輯性減弱的后果,他感到無奈。為讓AI率更低,他不得不在論文中的許多實驗步驟前都加上了“我們”,原本清晰的實驗說明,變成了“我們通過……,并且我們通過……,從而我們就能得到”的贅余版本。
AI檢測器的誤判概率大嗎?一篇2024年教育技術(shù)領域的Q1級頂刊論文在檢測了七款國外主流AI檢測器后發(fā)現(xiàn),這些檢測器對未經(jīng)過改寫的AI生成內(nèi)容的平均識別準確率為39.5%,對于人類寫作的對照樣本識別準確率為67%。這意味著人類有33%的概率被誤判為AI,而AI卻有高于60%的概率可以蒙混過關。
在新版本發(fā)布的公告中,格子達將其中一條區(qū)分人與AI創(chuàng)作的標準描述為:人類寫作存在合理的不確定性,AI生成的文本過于“流暢”。這也導致了大學生們的無奈:為了降低AI率,不得不把論文改“笨”。
網(wǎng)友@江楓漁火對愁眠 分享了為AI率折腰的經(jīng)歷,她抱著把論文修改到最好的心態(tài),卻不得不弱化邏輯性,改書面語為口語,“雖然AI率達標了,終于定稿了,但是我對自己的論文不滿意了,自己把自己的論文改爛真的很難受”。
網(wǎng)絡上也有不少經(jīng)驗帖分享用AI打敗AI的方法,但更改后的論文質(zhì)量大打折扣。嘗試過用系統(tǒng)降低AI率的一帆表示,AI改寫的語句“不像人寫的”。刪減邏輯詞、增加口水話后,論文與嚴謹、專業(yè)的大眾印象漸行漸遠。
采納AI檢測器,國外高校態(tài)度審慎
除了類似“AI 檢測率”這樣的硬指標劃定,國內(nèi)一些高校也在探索其他規(guī)范使用 AI 的方式,比如中國傳媒大學繼續(xù)教育學部設計了《本科畢業(yè)論文(設計)生成式人工智能使用情況說明表》,由學生自主披露論文中的 AI 使用情況。
而使用了AI智評系統(tǒng)的廣東海洋大學也在指導文件里公布了允許使用AI工具的范圍,如“可用于文獻檢索、關鍵詞推薦和文獻管理,但需確保引用文獻的真實性與可靠性??捎糜谕扑]統(tǒng)計圖表類型和輔助制圖,但不得用于生成或修改原始研究數(shù)據(jù)及關鍵研究圖表”。
關于AI檢測器,美國前20所頂尖高校普遍持“不建議使用”態(tài)度,考慮的主要因素為現(xiàn)有檢測技術(shù)不成熟、系統(tǒng)無法提供證據(jù)、誤判和漏判現(xiàn)象頻出。
Open AI公司在官網(wǎng)“教育者常見問題解答”中稱:“我們對檢測器的研究表明它們并不可靠,因為教育工作者可能會對學生作出判斷,并造成長期影響”。在訓練過程中,其研發(fā)的AI生成內(nèi)容檢測器將莎士比亞的作品和《獨立宣言》等人類撰寫的內(nèi)容標記為 AI 生成。
國內(nèi)主流AIGC檢測平臺目前并未披露具體的訓練集;對于相關的大模型原理,公開表述也比較模糊。以維普為例,其在官網(wǎng)對于判斷標準的描述是“AIGC檢測是運用AI大模型,預先對各大AIGC模型生成的海量文本數(shù)據(jù)進行特征反向演算,掌握AIGC模型文本生成的規(guī)律”。
根據(jù)同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司2025年1月24日公布的專利《AI生成學術(shù)文本的判斷方法、裝置及相關產(chǎn)品》,其檢測系統(tǒng)判定原理如下:首先“利用大模型對‘待判斷’學術(shù)文本進行改寫 ”,再通過對比改寫前后的文本,判斷該學術(shù)文本是否由AI生成。
AI檢測技術(shù)落后于AI生成技術(shù)的現(xiàn)狀,導致規(guī)避檢測變得相對容易。上文提及的檢測了七款國外主流AI檢測器的2024年頂刊論文還提到,即便是相對簡單的內(nèi)容操控(例如添加拼寫錯誤、增加文本波動性)也能非常有效地規(guī)避檢測;“具備技術(shù)敏感度、資源且有意愿的個體”則能更輕易將AI生成內(nèi)容偽裝成人類所寫。這就意味著,濫用AI技術(shù)的學生并不擔憂檢測器的考驗,而手寫論文的學生卻可能因誤判而受煎熬。
2024年12月,發(fā)表在中文核心期刊上的一篇論文《大語言模型技術(shù)背景下重塑研究生論文評價與指導》指出,高校采用“AIGC值”標準要求學生,可能容易導致師生之間陷入“貓捉老鼠”困境——“檢測軟件不斷更新?lián)Q代,抄襲者隨之不斷尋求新的規(guī)避辦法”?!皩W生將精力投入無意義的表達變換的文字游戲中”,或許才是AIGC檢測最大的隱患。
文中一帆、立君、晨夕均為化名
本文鏈接:http://m.enbeike.cn/news-8-4692-0.html用AI打敗AI,畢業(yè)論文AI檢測靠譜嗎?
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕