“忙不過來了?!睆拇汗?jié)到元宵,AI芯片和算力廠商的工程師們沒有停過一刻忙碌。
奔忙的背后是為了一條名為DeepSeek的“鲇魚”,其低算力、高性能、開源等特性,使原本卡在算力“瓶頸”中的國產(chǎn)AI再一次拉滿想象力。
從大年初四到大年初十,十多家國產(chǎn)AI芯片和算力企業(yè)相繼加入DeepSeek“朋友圈”,彼時工程師們忙的是DeepSeek模型的適配和服務(wù)上架;而如今,要問這些企業(yè)在忙什么,得到的回復(fù)可能會很統(tǒng)一——部署。
據(jù)了解,目前行業(yè)正從DeepSeek的適配過渡向部署和應(yīng)用,企業(yè)一方面迎來大量用戶咨詢,全力響應(yīng)用戶需求,另一方面也正在打造DeepSeek版智算一體機(jī),加速AI應(yīng)用落地?!癉eepSeek真正能成為生產(chǎn)力工具、滿足應(yīng)用落地需求的大模型,可以預(yù)期,2025年大模型的應(yīng)用落地會爆發(fā)起來?!睒I(yè)內(nèi)人士稱。
過去兩年多,ChatGPT帶飛了算力產(chǎn)業(yè),并將英偉達(dá)送上“國王寶座”。國產(chǎn)算力廠們苦尋出路。如今,DeepSeek鑿開了一個口子,天光已現(xiàn),但國產(chǎn)算力能否一飛沖天,還有待考驗(yàn)。
有業(yè)內(nèi)人士分析,DeepSeek帶來推理算力需求激增,行業(yè)可能迎來新一輪的洗牌,未來或是性價比之爭。
2月13日,DeepSeek概念股午后再度拉升走高,宏景科技20cm漲停,優(yōu)刻得(688158.SH)、弘信電子(300657.SZ)、并行科技(839493.BJ)漲超10%。
圖源:圖蟲創(chuàng)意
緊急“適配”
事實(shí)上,國產(chǎn)算力廠商的“適配潮”仍在繼續(xù)。
例如,早在2月4日,華為就宣布聯(lián)合硅基流動首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù)。但直到2月12日,華為云才再次發(fā)文宣布,DeepSeek V3/R1滿血版上線。
截至目前,雖已有超15家芯片廠商適配了DeepSeek模型,但據(jù)時代財經(jīng)不完全統(tǒng)計,明確宣布適配DeepSeek R1及V3原版模型的不到一半。
圖源:時代財經(jīng)不完全統(tǒng)計梳理
多數(shù)企業(yè)宣稱能在“幾小時內(nèi)”“一天內(nèi)”可以快速完成適配的,但大部分僅是DeepSeek R1的系列蒸餾模型,而原版或稱“滿血版”的模型適配仍在進(jìn)行中。
云天勵飛(688343.SH)副總裁、芯片業(yè)務(wù)線總經(jīng)理李愛軍告訴時代財經(jīng),在適配上線過程中,DeepSeek的模型可分為兩類,其一是基于DeepSeek R1蒸餾了一些參數(shù)小的模型,包含1.5B、7B、14B以及70B等大模型,這些蒸餾模型的原始模型是通義千問和LLAMA,那么原本能夠支持通義千問和LLAMA模型的平臺,基本上就能適配這些DeepSeek的蒸餾模型,這一塊的工作量相對較小,企業(yè)一般花費(fèi)一周左右就能適配完成。
另一類則是DeepSeek V3和DeepSeek R1的原版模型,這是DeepSeek自研的原生態(tài)MOE大模型,其參數(shù)量達(dá)到了671B,里面囊括了MLA等新的算子,考驗(yàn)著芯片適應(yīng)超大規(guī)模MOE架構(gòu)、支持新型算子、稀疏MoE模型的執(zhí)行效率等的能力。
而其中最大的難點(diǎn)在于模型本身的參數(shù)量大。“目前,國產(chǎn)HBM(高帶寬存儲器)芯片的容量不大,在用于推理的人工智能計算場景中,16GB、32GB乃至64GB的HBM容量已經(jīng)被認(rèn)為是較大的配置了。但即使是使用64GB的芯片來運(yùn)行671B參數(shù)的大模型,要把參數(shù)加載到芯片中,也至少需要11張×64GB的芯片才能勉強(qiáng)放下這個模型。這也意味著單卡無法解決問題,牽涉到卡與卡之間的互聯(lián)能力和效率?!崩類圮娬劦?,因此,適配的時長取決于各家的基礎(chǔ)。基礎(chǔ)好、投入大的,一到兩周就能完成適配,技術(shù)次于此的,可能在兩三周左右能夠適配完,或者更長時間,有的甚至無法適配。
昆侖芯科技也表示,理論上,各類大模型的常規(guī)模型、常規(guī)組網(wǎng)能直接跑通,然而難免會出現(xiàn)特殊算子、特殊規(guī)模,需要投入人力進(jìn)行針對性調(diào)試。跑通只是基礎(chǔ),后期涉及后端硬件不同、算子實(shí)現(xiàn)不同、對應(yīng)軟件版本不同等因素,精度對齊、性能對齊也都需要人力介入進(jìn)行針對性適配。
不過,也有行業(yè)人士向時代財經(jīng)透露,由于DeepSeek本身開源,適配過程中并不需要授權(quán),盡管目前眾多平臺都在適配該模型,但這種適配可能并非真正意義上的“接入”。“真正意義上的接入是DeepSeek利用某個智算中心提供云服務(wù),但是目前真正和DeepSeek達(dá)成這種合作的廠商非常少,可能只有一兩家。”
部署和落地
適配之外,更關(guān)鍵的是部署。
近期,并行科技(839493.BJ)、壁仞科技、摩爾線程和昆侖芯科技等多家企業(yè)均向時代財經(jīng)透露,他們正在忙于為客戶做DeepSeek模型的部署。
“部署是大模型轉(zhuǎn)化為生產(chǎn)力的必要步驟?!敝写嫠惆雽?dǎo)體董事長陳巍解釋,部署相當(dāng)于在用戶的生產(chǎn)環(huán)境里進(jìn)行模型的安裝設(shè)置和做與客戶成產(chǎn)環(huán)境的連接。
時代財經(jīng)在某國產(chǎn)算力運(yùn)營商的產(chǎn)品交流群中觀察到,不少用戶在詢問如何導(dǎo)入和設(shè)置API、如何集成相關(guān)服務(wù),還有人咨詢DeepSeek模型接入后為何運(yùn)行速度較慢等。
“行業(yè)確實(shí)正處于模型應(yīng)用落地的關(guān)鍵階段?!?月12日,摩爾線程相關(guān)技術(shù)負(fù)責(zé)人向時代財經(jīng)表示。
時代財經(jīng)了解到,在近期行業(yè)密集適配DeepSeek系列模型后,不少廠商開始尋求落地應(yīng)用,智算一體機(jī)這種硬件部署形式于是浮出了水面。
摩爾線程表示,公司正與雪浪云聯(lián)合打造了“軟硬件緊耦合”大模型訓(xùn)推一體機(jī)——雪浪MindCenter X100,就已成功部署DeepSeek-R1-Distill-Qwen(適配1.5B、7B、14B、32B)推理服務(wù)。
“一體機(jī)生意會是今年的大機(jī)會,離線需求太多了。”有業(yè)內(nèi)人士感慨道。
“前段時間大家都在適配,適配了之后呢?我們希望能夠在一些領(lǐng)域能夠?qū)崿F(xiàn)真正的應(yīng)用?!北谪鹂萍枷嚓P(guān)負(fù)責(zé)人告訴時代財經(jīng),壁仞科技聯(lián)合中興通訊、浙江大學(xué)上海高等研究院和一驀科技推出了智海AI教育一體機(jī)。該產(chǎn)品實(shí)現(xiàn)了國產(chǎn)算力與DeepSeek的適配及知識課程、實(shí)訓(xùn)課題、智能體等教學(xué)工具的設(shè)計開發(fā),并形成了包含AI通識課、專業(yè)課、實(shí)踐實(shí)訓(xùn)在內(nèi)的一體化解決方案。
2月11日,中國電信(601728.SH)和中國移動(600941.SH)兩大電信運(yùn)營商也分別推出了天翼云和移動云智算一體機(jī)-DeepSeek版。
據(jù)移動云官方消息,智算一體機(jī)簡單來說就是基于移動云邊緣智能小站算力底座打造的小型專屬云,專門為企業(yè)量身定制。它復(fù)用了邊緣智能小站的產(chǎn)品技術(shù),還有統(tǒng)一運(yùn)維、快速交付這些服務(wù),解決了企業(yè)在 AI 應(yīng)用落地時對數(shù)據(jù)安全的擔(dān)憂,還能提高AI應(yīng)用開發(fā)的效率。
圖源:移動云官方公眾號
此外,京東云、聯(lián)想(0992.HK)、科華數(shù)據(jù)(002335.SZ)、浪潮云、中國長城(000066.SZ)、天融信(002212.SZ)等企業(yè)均官宣發(fā)布了DeepSeek智算一體機(jī)。
行業(yè)或迎洗牌?
DeepSeek火了,順帶捧紅了國產(chǎn)算力,但也帶出了一系列疑問。DeepSeek時代需要怎樣的算力?DeepSeek又將如何改變?nèi)缃袼懔κ袌龅膽?zhàn)局?
此前,DeepSeek似乎已經(jīng)出現(xiàn)算力吃緊的現(xiàn)象。2月6日,DeepSeek暫停API(接口)充值服務(wù),DeepSeek官方解釋為服務(wù)器資源緊張。2月9日,DeepSeek調(diào)整收費(fèi)標(biāo)準(zhǔn),每百萬輸入tokens的價格為0.5元(針對緩存命中情況)和2元(針對緩存未命中情況),而輸出tokens的價格則定為每百萬8元。在優(yōu)惠期內(nèi),DeepSeek-V3對于輸入tokens的收費(fèi)是每百萬0.1元(緩存命中)和1元(緩存未命中),輸出tokens則是每百萬2元。
圖源:圖蟲創(chuàng)意
李愛軍認(rèn)為,在DeepSeek模型的性能足夠強(qiáng),而其未來很可能繼續(xù)延續(xù)開源的策略的情況下,企業(yè)能夠直接使用它進(jìn)行應(yīng)用落地,而非自己再重新訓(xùn)練出一個基礎(chǔ)模型。由此,未來推理側(cè)的算力需求將大規(guī)模爆發(fā)。
他表示,在模型訓(xùn)練環(huán)節(jié)追求的是極致的性能,哪怕GPU價格非常高,企業(yè)也不吝購買。一旦到了推理環(huán)節(jié),行業(yè)的關(guān)注點(diǎn)就會變成性價比,因?yàn)橥评頃r時刻刻都要使用,GPU芯片在推理時代性價比不突出,專門針對推理場景設(shè)計的ASIC芯片會大有機(jī)會。
“訓(xùn)練芯片和推理芯片在思路邏輯上有較大區(qū)別,訓(xùn)練芯片多選擇兼容CUDA架構(gòu),走的是GPU架構(gòu),推理芯片如云天勵飛等,多走的是神經(jīng)網(wǎng)絡(luò)處理架構(gòu)。從訓(xùn)練芯片向推理芯片的轉(zhuǎn)換,市場對芯片的要求、商業(yè)模式會有較大的變化?!崩類圮娡茰y,未來芯片行業(yè)可能將面臨新一輪洗牌。
摩爾線程相關(guān)技術(shù)負(fù)責(zé)人則認(rèn)為,從訓(xùn)練側(cè)來看,Scaling Law規(guī)模定律仍然有效,模型迭代會加快,對于國產(chǎn)優(yōu)質(zhì)訓(xùn)練算力的需求不會降低。長期看,模型參數(shù)規(guī)模擴(kuò)大(如GPT-5)和訓(xùn)練方法革新(如MoE)仍會推動訓(xùn)練算力需求增長;從推理側(cè)來看,隨著生成式AI應(yīng)用落地,落地應(yīng)用(如AIGC、智能體、垂直行業(yè)模型)將帶來海量碎片化推理需求,市場規(guī)模有可能超過訓(xùn)練。
該技術(shù)負(fù)責(zé)人表示,短期內(nèi),國產(chǎn)GPU廠商應(yīng)保持訓(xùn)練芯片的持續(xù)迭代,比如最好支持FP8,確保技術(shù)不脫節(jié),同時通過推理芯片快速切入商業(yè)化場景。從長期上,瞄準(zhǔn)“訓(xùn)推一體”架構(gòu),通過統(tǒng)一計算平臺降低客戶切換成本,最終在自主生態(tài)中實(shí)現(xiàn)訓(xùn)練與推理的協(xié)同增長。
至于DeepSeek的沖擊波能否影響到大洋彼岸的英偉達(dá),陳巍表示,沒有看到deepseek對英偉達(dá)的直接利空,但如果DeepSeek引發(fā)更大范圍更嚴(yán)格的禁運(yùn),那么可能使得英偉達(dá)GPU銷量減少。
“事實(shí)上,每一代模型的進(jìn)步,都意味著同等算力下模型精度更改。在以往模型的進(jìn)步并未引起英偉達(dá)市值下跌。對于deepseek這類大模型,由于參數(shù)量巨大,需要更低的存力成本。降本增效是擺在各廠家面前的關(guān)鍵?!标愇≌f道。
本文鏈接:http://m.enbeike.cn/news-2-524-0.htmlDeepSeek打響頭炮!國產(chǎn)芯片開打輔助:卷適配、卷落地、卷性價比
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇:節(jié)后6連板!浙數(shù)文化3度公告與DeepSeek無關(guān)聯(lián),仍遭機(jī)構(gòu)爆炒
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請點(diǎn)擊“
”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點(diǎn)擊“
”按鈕