在當今數(shù)字化時代,多模態(tài)技術(shù)正以前所未有的速度改變著世界。而在這場科技浪潮中,國產(chǎn)視頻大模型正悄然走在前列,成為全球科技創(chuàng)新的重要力量。
2025年3月29日,在全球科技創(chuàng)新交流合作的國家級平臺——中關(guān)村論壇上,清華大學人工智能研究院副院長、生數(shù)科技創(chuàng)始人兼首席科學家朱軍教授,發(fā)布的高可控視頻大模型Vidu Q1成為焦點,這一關(guān)鍵科技成果的發(fā)布標志著國產(chǎn)視頻大模型邁向了新的高度,為AI視頻生成走向“高可控”時代指明路徑。
中關(guān)村論壇作為匯聚全球頂尖科技資源與創(chuàng)新智慧的重要平臺,一直以來都是前沿科技展示與交流的絕佳舞臺。2024年4月,在中關(guān)村論壇未來人工智能先鋒論壇上,生數(shù)科技聯(lián)合清華大學正式發(fā)布了中國首個全面對標Sora的視頻大模型Vidu,這一創(chuàng)舉在當時便引起了業(yè)界的廣泛關(guān)注,開啟了國產(chǎn)視頻大模型發(fā)展的新篇章。時隔一年,生數(shù)科技再次回歸中關(guān)村論壇,帶來了更為強大的Vidu Q1模型,它在高可控方面的進展不僅是對自身技術(shù)實力的又一次突破,更是國產(chǎn)大模型在全球舞臺上崛起的重要標志。
在本次中關(guān)村論壇上,朱軍教授發(fā)表了主題為《中國多模態(tài)生成的全球引領(lǐng)》主旨演講。演講中,朱軍教授強調(diào)了國產(chǎn)視頻大模型在全球科技競爭中所扮演的關(guān)鍵角色及取得的多次技術(shù)突破,同時也分享了作為先行者的生數(shù)科技基于實際探索和預測的Vidu未來發(fā)展路徑,可以清晰地看到多模態(tài)技術(shù)在虛實結(jié)合、與物理世界交互等方面的更多可能。此次Vidu Q1模型的發(fā)布,不僅展現(xiàn)了中國在視頻大模型領(lǐng)域的深厚技術(shù)積累,更彰顯了國產(chǎn)大模型在全球范圍內(nèi)的引領(lǐng)實力。
Vidu Q1作為業(yè)內(nèi)首個高可控AI視頻大模型,其在多主體細節(jié)可控(特別是動作、布局可控)、音效同步可控、畫質(zhì)增強等方面均取得顯著成效,這使得它在眾多視頻大模型中脫穎而出。
以多主體細節(jié)可控為例,在語義指令的基礎(chǔ)上,通過融入?yún)⒖紙D的視覺指令,Vidu Q1支持對場景中多主體的位置、大小、運動軌跡等屬性進行更進一步的可控,對所有動作行為(出場、退場、坐立姿態(tài)、行動路線)進行精準調(diào)整。用戶能夠明顯體驗到用更低的抽卡率實現(xiàn)更高質(zhì)量的可控生成。
音效同步可控功能則確保了隨著視頻環(huán)境與畫面轉(zhuǎn)場,Vidu Q1能夠輸出生成相應(yīng)音效,并可精準控制每段音效的長短區(qū)間,精準設(shè)置每段音頻出現(xiàn)的時間點,如0-2s風聲、3-5s雨聲等,節(jié)省時間的同時,也大大增強了視頻的沉浸感與感染力。
Vidu Q1模型通過進一步增強畫質(zhì),則能夠為用戶帶去更加清晰、細膩、逼真的視覺體驗。
Vidu Q1的發(fā)布,不僅為視頻內(nèi)容創(chuàng)作領(lǐng)域帶來了革命性的變革,也為眾多行業(yè)的AI重構(gòu)提供了全新的思路與解決方案。
一直以來,AI視頻生成過程中的隨機性都是老大難問題,Vidu Q1針對AI視頻生成的痛點,通過技術(shù)手段引入多元素控制,它不再是沒有頭緒的亂生成,而是到了人為可控,這就讓AI視頻生成與當下精益求精制作逐漸趨向一致,對于追求極致的人來說,這是一個新的里程碑。
在動漫領(lǐng)域,通過對角色、物體、場景等的精確控制,能夠讓創(chuàng)作者快速生成高質(zhì)量動畫。日前好萊塢知名動漫工作室Aura Productions選擇與Vidu合作,計劃制作50集動畫短劇,其背后正是看重了Vidu在多主體一致性等可控生成方面的世界領(lǐng)先優(yōu)勢。
在廣告領(lǐng)域,傳統(tǒng)廣告制作流程復雜,通過視頻大模型的高可控性,可以精準呈現(xiàn)品牌元素和創(chuàng)意概念。
在影視短劇領(lǐng)域,Vidu的高可控生成能力則可確保短劇畫面中角色和場景的連貫性。在更多領(lǐng)域,Vidu正在重構(gòu)千行百業(yè),創(chuàng)造更多可能。
此次生數(shù)科技Vidu Q1的發(fā)布,使世界看到中國科技創(chuàng)新公司通過堅持科技自立自強賦能新質(zhì)生產(chǎn)力的發(fā)展。期待中國的AI視頻生成賽道玩家能夠持續(xù)在世界舞臺上舞出風采,在百家爭鳴中,實現(xiàn)中國多模態(tài)技術(shù)的極大發(fā)展和人人可感知到的現(xiàn)實應(yīng)用。(固原新聞網(wǎng))
本文鏈接:http://m.enbeike.cn/news-1-43862-0.html重磅!生數(shù)科技發(fā)布業(yè)內(nèi)首個高可控視頻大模型Vidu Q1
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,不代表本站觀點,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕