亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

語言文字領域重大部署:國家隊開工新基建,高品質“投喂”大模型

3個月前 來源: 觀看:38

21世紀經濟報道記者王峰北京報道  語言文字是大模型的資源池,語料庫的質量決定著大模型的發(fā)展。而在大模型時代,語言文字已成為賦能產業(yè)發(fā)展的數據要素。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

近日,教育部、國家語委、中央網信辦印發(fā)《關于加強數字中文建設 推進語言文字信息化發(fā)展的意見》(以下簡稱《意見》),全面謀劃數字中文建設。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

在3月31日教育部新聞發(fā)布會上,教育部語言文字信息管理司司長劉培俊指出,《意見》創(chuàng)新應用自然語言處理、大語言模型、多模態(tài)信息處理、知識圖譜、語料加工等五項前沿技術,重點服務大語言模型等人工智能技術創(chuàng)新應用“制高點”,夯實國家關鍵語料基礎設施“新基建”。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

數字中文推動產業(yè)升級

20世紀80年代,王選院士的團隊發(fā)明激光照排技術,并結合漢字的編碼標準,突破了中文數字化的空間限制,讓承載中華文化的中文在全球互聯(lián)網空間獲得新生。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

當前,大語言模型技術對大規(guī)模高質量語料提出前所未有的需求,賦予了數據中文化新的歷史內涵和使命任務。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

3月31日教育部新聞發(fā)布會  圖片來源:教育部官網
S1U即熱新聞——關注每天科技社會生活新變化gihot.com

北京大學王選計算機研究所所長湯幟認為,新形勢下,語言文字將實現(xiàn)與信息技術的深度融合,要形成“技術突破—場景落地—生態(tài)繁榮”的良性循環(huán),打造數字化引領品牌,有力服務教育發(fā)展、助力科技創(chuàng)新、賦能文化傳承、推動產業(yè)升級、促進社會進步。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

《意見》特別提出,要實施數字中文推動產業(yè)升級行動。支持語言文字信息技術新產品、新職業(yè)和新業(yè)態(tài)發(fā)展,鼓勵傳統(tǒng)語言產業(yè)數字化轉型升級,培育基于數字中文的新型語言產業(yè)。推動語言資源、語言翻譯、智能機器人、中文內容服務等軟硬件產品研發(fā)應用,支持圍繞語音、語料、語言應用生態(tài)形成產業(yè)聚集,鼓勵創(chuàng)建語言產業(yè)應用示范品牌。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

湯幟介紹,新形勢下,語言文字將實現(xiàn)從“靜態(tài)符號”向“動態(tài)數字資產”,從“信息載體”向“生產要素”的轉型,要重點推動語料庫、數據標注與評價等標準的研制,支持文本生成與理解、語言翻譯、情感分析等各種任務。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

比如,廣東省教育廳在廣州大學設立粵語語料庫建設與大模型評測重點實驗室,為語料基礎設施建設、語言智能應用等提供堅實數據支撐,指導深圳大學建立語言障礙多模態(tài)數據庫,涵蓋漢語失語癥語料庫、兒童語言障礙語料庫,有力服務語言康復研究。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

北京師范大學針對古漢語信息處理任務“低資源”“富知識”的特點,以解決領域知識學習需求為核心任務,使用1.8B(18億)參數量,訓練出“AI太炎”古漢語大語言模型。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

北京師范大學副校長康震介紹,該模型在確保語料來源安全、語料內容安全、語料標注安全、模型安全等基礎上,能夠高質量完成古典文獻釋讀,支持字詞釋義、文白翻譯、句讀標點、用典分析等多種具有挑戰(zhàn)性的文言文理解任務。截至目前,該模型已廣泛應用于海內外的學術科研、基礎教育、編輯出版等多個領域,輔助古籍整理、語言研究、語文教育、辭書編纂等應用場景任務。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

建設新型國家語料庫

《教育強國建設規(guī)劃綱要(2024—2035年)》提出,要建設新型國家語料庫?!兑庖姟芬蔡岢觯?027年初步建成國家關鍵語料庫。語料庫在語言文字信息化工作中發(fā)揮什么樣的作用,下一步將如何推進?S1U即熱新聞——關注每天科技社會生活新變化gihot.com

劉培俊指出,將聚焦“需求”這一關鍵。在關鍵學科、重點行業(yè)、戰(zhàn)略區(qū)域、民生期待和社會急需領域,分批建設規(guī)范、安全、優(yōu)質的國家關鍵語料庫。目前,教育部、國家語委已經支持建設了30余項關鍵領域的語料庫。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

北京師范大學已建設了通用漢字全息數據庫,《說文》學數字資源庫、歷代碑刻與手寫文字屬性資源庫、甲骨文拓片資源庫等專業(yè)數字資源庫。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

劉培俊指出,目前,教育部、國家語委已經支持布局了五個領域的自主安全可控大語言模型建設項目,下一步將根據需求穩(wěn)步擴大建設范圍,提升建設成效。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

下一步,將逐步建立健全語料共建共享新機制,研制語言資源、語言數據、基礎語料以及大語言模型的技術和管理標準,依托高校研究機構推進多學科交叉融合,為語言科技、語料建設以及人工智能創(chuàng)新應用培養(yǎng)高素質人才。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

教育部語言文字應用管理司副司長王暉指出,當前以DeepSeek等為代表的人工智能技術創(chuàng)新不斷取得突破性的進展,在這個大背景下,國家提出這樣一個戰(zhàn)略部署,建設新型國家語料庫,凸顯了其重要性、必要性和緊要性,我們應當積極統(tǒng)籌、廣泛協(xié)同、大力推進。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

“但是很多語料庫還處于單一文本模式和領域應用階段,在建設的理念、技術和方法、規(guī)模,以及數據多樣性、時效性尤其是與人工智能相結合的大規(guī)模應用方面還存在不足,難以滿足多元化、動態(tài)化尤其是智能化的語言數據需求。”王暉說。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

對此,下一步將立足人工智能時代大背景,突破傳統(tǒng)語料庫單一文本模式和領域應用壁壘,以大模型訓練及性能評測、智能計算為核心,以新質態(tài)、多模態(tài)、多語言、大規(guī)模、全域性為突出特性,為通用領域和細分領域多場景應用及創(chuàng)新發(fā)展提供規(guī)范、可信、高質量的語言文化語料資源。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

據介紹,目前已經啟動開發(fā)建設“中華文脈新型語料庫”“中華大閱讀體系語料庫”,以這兩個示范庫建設整體打造出標桿。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

“中華文脈新型語料庫可以簡單理解為瞄準的是智慧教師,中華大閱讀體系語料庫瞄準的是智慧學伴。在此基礎上,探索建設系列教育、語言文化國家新型語料庫群,服務教育強國、文化強國建設?!蓖鯐熣f。S1U即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://m.enbeike.cn/news-1-43895-0.html語言文字領域重大部署:國家隊開工新基建,高品質“投喂”大模型

聲明:本網頁內容旨在傳播知識,不代表本站觀點,若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。

上一篇:國內獨角獸企業(yè)估值超1.5萬億美元!北京獨角獸企業(yè)數量和估值全國第一

下一篇:緬甸強震已致該國2056人遇難

為你推薦
目前在品牌金飾市場,克單價800元以下的商品已很難看到了。2月4日,周大福官網報出的足金飾品價格為846元/克,周生生報出的價格更是達到852元/克,均為品牌足金飾品售價的歷史高位...
02-04
新華社布宜諾斯艾利斯2月5日電(記者張鐸)阿根廷政府5日宣布,阿總統(tǒng)米萊已決定該國退出世界衛(wèi)生組織。阿根廷總統(tǒng)府發(fā)言人阿多爾尼當天在新聞發(fā)布會上說,阿根廷不允許任何國際組...
02-06
AI教父黃仁勛再次現(xiàn)身中國!1月15日,英偉達創(chuàng)始人兼CEO黃仁勛在深圳接受媒體采訪時表示,“我是來和我的員工一起慶祝春節(jié)的,這就是我的...
01-21
美國研究人員開發(fā)出一個新的人工智能模型,經過大量數據的訓練后,該模型能精確預測各種人體細胞內部的基因表達情況,將為生物和醫(yī)學研究帶來便利。這個...
01-27
  1月26日起,我省迎來強降雪寒潮大風天氣。省住房城鄉(xiāng)建設廳根據氣象部門預報信息,提前印發(fā)通知,要求各...
01-28
  新華社北京1月31日電(記者鄒多為)據海關統(tǒng)計,2024年我國東北地區(qū)進出口達到1.25萬億元,同比增長1.6%,規(guī)...
02-01
  研究發(fā)現(xiàn),消費券能顯著增加交易活躍程度,且對低收入人群增加消費,可以有明顯的提振作用。但要讓消費券發(fā)揮理想的效果,不僅要精準把握發(fā)放的時間節(jié)點,還要確保民眾有穩(wěn)定...
01-21
  中新經緯1月17日電 (魏薇)“到2025年,百貨行業(yè)將更加注重數字化、智能化和綠色可持續(xù)發(fā)展。物流和供應鏈將繼續(xù)整合,智能技術在商業(yè)運營中的應用也將擴大。” 近日,希臘華...
01-21
1 月 27 日消息,山東青島今天發(fā)布青島市智能網聯(lián)新能源汽車產業(yè)發(fā)展行動計劃(2025—2027 年),文件提到青島將打造全國重要的智能網聯(lián)新能源汽車創(chuàng)新應用高地、新能源商...
01-28
1 月 31 日消息,據小鵬汽車官方,近日該公司先后在都柏林與赫爾辛基舉辦發(fā)布會,小鵬 G9 在芬蘭登場,而小鵬 G6 在芬蘭與愛爾蘭同時亮相。▲ 圖源小鵬汽車公眾號在此之前,...
02-01
最近幾天,多部新劇開播,其中備受期待的《余燼之上》一經播出便獲得了巨大成功和廣泛關注。該劇在各大社交平臺頻繁成為話題和熱搜。接下來,我們將探討《余燼之...
02-22
近期,電視劇《難哄》在各大短視頻平臺爆火,劇中角色桑稚的首次登場引起了廣泛關注。她在第1集跨年夜短暫出現(xiàn),給觀眾留下了深刻印象。當時,她正在經歷高三階段,...
02-22
據國家衛(wèi)生健康委消息,1月22日,國家衛(wèi)生健康委辦公廳、國家中醫(yī)藥局綜合司發(fā)布流行性感冒診療方案(2025年版)。國家衛(wèi)生健康委表示,為進一步提...
01-23
  “當前,全國范圍內呼吸道傳染病流行情況已經下降,流感樣病例占比有所下降,肺炎支原體等陽性率持續(xù)下降,新冠病毒等其他呼吸道疾病繼續(xù)處于低流行水平?!痹?6日舉行的...
01-28
  大眾網記者 司心鵬 報道  12月25日,濟南特殊教育中心與濟南市公安局公共交通分局聯(lián)動會議在自強樓會議室召開?! 咸厥饨逃行牡膶W校領導熱情接待了來訪的警...
01-21
2025年上半年全國計算機等級考試將于2025年3月29日至31日舉行,報名工作即將開始,現(xiàn)將有關事項公告如下:一...
01-21
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕