“過去很多年,我們在數(shù)據(jù)應(yīng)用方面仍停留在做一些漂亮的統(tǒng)計報表上,并沒有深挖數(shù)據(jù)內(nèi)在價值。大部分?jǐn)?shù)據(jù)仍沉睡在云端服務(wù)器上,并沒有轉(zhuǎn)化為企業(yè)真正的資產(chǎn)?!比涨?,在由復(fù)旦大學(xué)校友會創(chuàng)業(yè)創(chuàng)新俱樂部主辦的第四屆創(chuàng)業(yè)創(chuàng)新數(shù)字經(jīng)濟(jì)生態(tài)論壇上,復(fù)旦大學(xué)計算機(jī)科學(xué)技術(shù)學(xué)院教授、博導(dǎo)、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華在主題演講過程中直言,當(dāng)前,數(shù)據(jù)價值變現(xiàn)也面臨諸多挑戰(zhàn)。
復(fù)旦大學(xué)計算機(jī)科學(xué)技術(shù)學(xué)院教授、博導(dǎo)、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華
肖仰華認(rèn)為,造成這類現(xiàn)象的困境有多層原因?,F(xiàn)階段數(shù)據(jù)管理處于多主體狀態(tài),“今天可能在生產(chǎn)者手中,明天可能在采集者手中,之后會流通到加工者、使用者、運(yùn)營者手中”,這種多方主體的狀態(tài),使得數(shù)據(jù)的確權(quán)和數(shù)據(jù)安全是否可控面臨較高要求。
此外,數(shù)據(jù)運(yùn)行的環(huán)境和生態(tài)也前所未有地復(fù)雜。肖仰華指出,數(shù)據(jù)運(yùn)行的形態(tài)極為多樣。數(shù)據(jù)可能運(yùn)行于傳統(tǒng)數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫、云數(shù)據(jù)庫,也可能存在于文件中,甚至可能成為大模型的語料。
隨著數(shù)據(jù)管理的復(fù)雜性和多樣性增加,肖仰華稱,對企業(yè)發(fā)展統(tǒng)一、標(biāo)準(zhǔn)化的數(shù)據(jù)管理和操作方法也提出新需求。在數(shù)據(jù)價值變現(xiàn)層面上,如何喚醒、盤活“沉睡的數(shù)據(jù)”?
肖仰華認(rèn)為,人工智能時代,大模型有可能成為盤活沉睡數(shù)據(jù)資產(chǎn)的“利器”,大模型有利于將數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值。
肖仰華稱,大模型之所以被各行各業(yè)積極擁抱,是因?yàn)樗鼧O大地簡化了傳統(tǒng)的商業(yè)變現(xiàn)流程?,F(xiàn)在甲方只需提前提供數(shù)據(jù),大模型就能自動從數(shù)據(jù)中學(xué)習(xí)到領(lǐng)域知識支撐下游應(yīng)用,從而形成商業(yè)價值,無需再與資產(chǎn)方進(jìn)行復(fù)雜的溝通,這種端到端的方式為商業(yè)應(yīng)用帶來了極大的便利。
此外,在多模態(tài)數(shù)據(jù)的統(tǒng)一價值變現(xiàn)上,以前收集到的數(shù)據(jù)庫服務(wù)器可能是文本格式、圖像格式,也可能是語音或表格,各類各樣都有。但如今,只要將這些數(shù)據(jù)統(tǒng)一轉(zhuǎn)換成序列數(shù)據(jù),就可以通過大模型進(jìn)行訓(xùn)練,從而實(shí)現(xiàn)統(tǒng)一的數(shù)據(jù)價值變現(xiàn)方式。
不僅如此,大模型還在數(shù)據(jù)庫的智能化運(yùn)維方面發(fā)揮了重要作用。傳統(tǒng)數(shù)據(jù)庫應(yīng)用系統(tǒng)需要大量人力和資金投入運(yùn)營,而大模型的自動化運(yùn)維能力可以顯著提高運(yùn)維效率,解放人力資源。
不過,盡管大模型為釋放企業(yè)和各類行業(yè)數(shù)據(jù)價值帶來了全新機(jī)遇,但仍面臨諸多挑戰(zhàn)。
肖仰華認(rèn)為,其中一個挑戰(zhàn)在于,目前的通用大模型以聊天或開放性任務(wù)為主,仍存在“幻覺”現(xiàn)象、專業(yè)知識不足以及專業(yè)思維能力較弱等。還有大模型在可控性和編輯能力上較弱,無法實(shí)現(xiàn)像傳統(tǒng)數(shù)據(jù)庫那樣精準(zhǔn)地刪除或更新操作,這在行業(yè)應(yīng)用中帶來了較大的挑戰(zhàn)。
在私域數(shù)據(jù)和專業(yè)數(shù)據(jù)的理解上,大模型也有待提升。譬如,不同行業(yè)數(shù)據(jù)具有兩個基本特點(diǎn),其一是專業(yè)性強(qiáng),例如工業(yè)傳感器數(shù)據(jù),如果沒有專業(yè)背景知識,很難理解數(shù)據(jù)背后的含義;其二是私域數(shù)據(jù)的表達(dá)有自身獨(dú)特性,例如不同數(shù)據(jù)庫中對“性別”的編碼可能截然不同(如0和1分別代表男和女),這類私域數(shù)據(jù)編碼通用大模型能否直接理解,也是大模型在行業(yè)落地時需要解決的關(guān)鍵問題。
肖仰華在演講中也提到,企業(yè)在利用大模型做數(shù)據(jù)處理與價值變現(xiàn)相關(guān)工作時,也需關(guān)注成本問題,“大模型的運(yùn)行存在成本,因此通常采用大模型蒸餾小模型的方式以降低成本?!贝竽P椭饕糜陉P(guān)鍵場合,或在小模型及人工難以處理的復(fù)雜場景中發(fā)揮作用,從而優(yōu)化整體方案的成本。
“我們相信,在大模型和人工智能技術(shù)的助力下,數(shù)據(jù)價值將很快被徹底激活?!毙ぱ鋈A說。
本文鏈接:http://m.enbeike.cn/news-8-2433-0.html肖仰華:大部分?jǐn)?shù)據(jù)仍沉睡在服務(wù)器,尚未轉(zhuǎn)化為真正的資產(chǎn)
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請點(diǎn)擊“
”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點(diǎn)擊“
”按鈕