▲示意圖
似乎就在一夜之間,來(lái)自中國(guó)的AI公司DeepSeek(深度求索)在大洋彼岸全面“破圈”,從高高在上的美股巨頭,到使用AI工具的普通用戶都被DeepSeek最新發(fā)布的R1模型深深震撼。
當(dāng)?shù)貢r(shí)間27日,DeepSeek應(yīng)用登頂蘋果美國(guó)地區(qū)應(yīng)用商店免費(fèi)App下載排行榜,在美區(qū)下載榜上超越了ChatGPT。Meta、Open AI等科技巨頭員工發(fā)帖稱,公司內(nèi)部已開啟了“恐慌模式”,緊急制定對(duì)策。德國(guó)經(jīng)濟(jì)學(xué)家豪爾格·查皮茲表示,DeepSeek將成為“美國(guó)股市的最大威脅”。美國(guó)“投資百科”網(wǎng)站稱,特朗普才剛剛喊出5000億美元的“星際之門”計(jì)劃,就被中國(guó)一個(gè)僅僅訓(xùn)練了2個(gè)月的AI模型打擊了信心。
當(dāng)?shù)貢r(shí)間27日,阿斯麥、英偉達(dá)、博通盤前跌超10%,臺(tái)積電跌超9%。
據(jù)報(bào)道,DeepSeek創(chuàng)始人梁文鋒1985年出生于廣東省湛江市吳川市,根據(jù)領(lǐng)英等網(wǎng)站公開可查的資料,DeepSeek團(tuán)隊(duì)成員約超過(guò)一半為95后,90后占比超過(guò)75%。梁文鋒曾表示,公司員工“都是一些Top高校的應(yīng)屆畢業(yè)生、沒畢業(yè)的博四、博五實(shí)習(xí)生,還有一些畢業(yè)才幾年的年輕人”。DeepSeek內(nèi)部的團(tuán)隊(duì)氛圍也較為寬松,梁文鋒曾表示團(tuán)隊(duì)中每一個(gè)成員可以調(diào)用的資源都“沒有上限”,并且管理制度上非常推崇扁平化。
“低成本訓(xùn)練”震撼美國(guó)巨頭
專家:對(duì)美股泡沫沖擊大
去年12月26日,DeepSeek發(fā)布的V3模型就初露鋒芒,以大約Open AI二十分之一的訓(xùn)練成本獲得了比肩世界頂級(jí)性能的大模型。緊接著在今年1月20日,DeepSeek再度發(fā)布R1模型。美國(guó)加州的Scale AI公司致力于測(cè)評(píng)各種AI模型的實(shí)際性能,其創(chuàng)始人亞歷山大·王在接受采訪時(shí)表示:“老實(shí)說(shuō),我覺得DeepSeek在很多項(xiàng)指標(biāo)上都達(dá)到了美國(guó)最先進(jìn)模型的水平”。
除了性能優(yōu)異,DeepSeek作為一個(gè)開源模型,對(duì)終端用戶始終免費(fèi)開放,而它對(duì)于開發(fā)者調(diào)用API的收費(fèi)定價(jià)水平幾乎為Open AI的百分之一。此前DeepSeek曾公開回應(yīng)“價(jià)格戰(zhàn)”的指控,表示在這樣的定價(jià)之下自己仍有合理的利潤(rùn)結(jié)構(gòu)。低廉的價(jià)格來(lái)源于該公司在軟件算法層面的創(chuàng)新,改變了美國(guó)科技巨頭們囤積GPU顯卡“堆算力”的慣性思維。據(jù)悉R1的訓(xùn)練只調(diào)用了2000余塊顯卡,為期53天,總的訓(xùn)練成本僅為558萬(wàn)美元,不到其他世界頂級(jí)大模型一次訓(xùn)練成本的十分之一。
這樣的極致性價(jià)比,讓在AI熱潮下被炒高了兩年的美國(guó)科技股感到巨大的“寒意”。豪爾格·查皮茲25日寫道:“這家中國(guó)公司以極端低廉的成本,在缺少最頂尖芯片供應(yīng)的情況下打造出一個(gè)震動(dòng)世界的模型,這是對(duì)美股泡沫構(gòu)成的最大威脅?!泵绹?guó)經(jīng)濟(jì)學(xué)家亞德尼表示,“DeepSeek的成功可能會(huì)給美股財(cái)報(bào)季帶來(lái)壓力,尤其是在谷歌、Meta和微軟等公司加大AI資本投入的情況下。尤其是微軟,它是OpenAI的最大投資者?!?span style="display:none">aNF即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
在DeepSeek熱潮的帶動(dòng)下,英偉達(dá)股價(jià)在當(dāng)?shù)貢r(shí)間26日下跌3.12%。27日盤前,英偉達(dá)股價(jià)重挫超10%,帶動(dòng)納指期貨下跌4%。英偉達(dá)下一次財(cái)報(bào)公布預(yù)計(jì)在2月26日。27日,A股市場(chǎng)迎來(lái)春節(jié)前最后一個(gè)交易日,一些“算力概念股”也因DeepSeek的成功受到影響。不過(guò)和DeepSeek公司關(guān)聯(lián)較深的浙江東方、每日互動(dòng)等個(gè)股出現(xiàn)一字漲停。
此外有Meta員工在論壇匿名發(fā)帖表示,公司內(nèi)部針對(duì)DeepSeek崛起的威脅感到高度緊張。“畢竟人家模型的訓(xùn)練成本還不如Meta一位高管的年薪,而我們這里有幾十位這樣的高管,想想這些人怎樣才能向上級(jí)交差吧。”
創(chuàng)始人梁文鋒:
85后“老股民”從量化投資起家
▲梁文鋒(右)參加工作座談會(huì)
據(jù)湛江發(fā)布,DeepSeek創(chuàng)始人梁文鋒是吳川市覃巴鎮(zhèn)米歷嶺村人,父母都是小學(xué)語(yǔ)文老師?!?5后”的梁文鋒從小就是“學(xué)霸”,在數(shù)學(xué)方面天賦突出。同學(xué)們反映,梁文鋒并非“書呆子”類型,而是很有獨(dú)立思考的精神。梁文鋒本科和碩士都就讀于浙江大學(xué),2008年,研究生畢業(yè)的梁文鋒并沒有走上“碼農(nóng)”的道路。當(dāng)時(shí)推崇“量化投資之父”西蒙斯的他和朋友一起在出租屋內(nèi)刻苦鉆研,想要找到對(duì)股票價(jià)格建模的方法。
2010年,滬深股指期貨推出,這給了梁文鋒充分發(fā)揮計(jì)算機(jī)建模天賦的機(jī)會(huì)。很快他的自營(yíng)資金盤就達(dá)到了5億元的水平。2015年,梁文鋒與校友一起共同創(chuàng)立幻方量化,在A股市場(chǎng)系統(tǒng)性地進(jìn)行量化交易。2021年,幻方量化的資產(chǎn)管理規(guī)模達(dá)到千億水平,被譽(yù)為國(guó)內(nèi)四大頂級(jí)量化私募之一。
幻方量化的成功離不開人工智能的深度融合,梁文鋒很早就產(chǎn)生了用AI自動(dòng)制定量化交易策略的想法,并堅(jiān)持不懈地付諸實(shí)踐。2020年,英偉達(dá)發(fā)布了A100芯片,這是英偉達(dá)下一代旗艦作品,而幻方量化成為亞太地區(qū)第一批拿到貨的客戶?;梅搅炕嗄陙?lái)不僅儲(chǔ)備了大量的尖端芯片,而且在軟件算法層面不斷推陳出新,這給梁文鋒在AI領(lǐng)域的創(chuàng)業(yè)奠定了扎實(shí)的基礎(chǔ),2023年7月他創(chuàng)立了DeepSeek(全稱“杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司”)。
DeepSeek團(tuán)隊(duì):
90后、95后為主,喜歡“高潛力年輕人”
據(jù)報(bào)道,DeepSeek的員工規(guī)模不到140人,是Open AI的十分之一左右。據(jù)領(lǐng)英網(wǎng)站檢索樣本發(fā)現(xiàn),DeepSeek員工85%以上擁有碩士學(xué)位,40%以上有博士學(xué)位。團(tuán)隊(duì)成員平均年齡約為28歲,90后占比超75%,95后(1995年后出生)員工占比50%以上。該公司成員大多畢業(yè)于北大、清華、中科大等國(guó)內(nèi)頂尖院校,也有少數(shù)畢業(yè)于麻省理工學(xué)院、卡內(nèi)基梅隆大學(xué)等海外知名高校。同時(shí)DeepSeek的員工中也有相當(dāng)一部分具有交叉學(xué)科背景。
▲幻方量化旗下大模型公司DeepSeek
和動(dòng)輒上千人的“大廠”AI開發(fā)團(tuán)隊(duì)相比,DeepSeek百余人的規(guī)模顯得相當(dāng)精煉,并且在選人標(biāo)準(zhǔn)上兩者也大有不同:互聯(lián)網(wǎng)公司一般看重成熟的經(jīng)驗(yàn),最好有在核心項(xiàng)目成功過(guò)的經(jīng)歷,而DeepSeek則喜歡“高潛力年輕人”。以該公司選擇的“稀疏訓(xùn)練”技術(shù)路徑為例,剛畢業(yè)的博士生由于在學(xué)校里接觸過(guò)相關(guān)前沿課題,對(duì)這一技術(shù)路徑更加熟悉,而“業(yè)界老鳥”則不一定對(duì)最新技術(shù)能保持高度敏感。
據(jù)“智能涌現(xiàn)”,一名曾與DeepSeek有過(guò)合作的獵頭表示,DeepSeek非常偏愛沒有工作經(jīng)驗(yàn)的年輕人,而且指明不要資深人士,“工作經(jīng)驗(yàn)在3~5年已經(jīng)是最多的了,工作超8年的基本就pass了”。
梁文鋒曾在采訪中表示,留住年輕人才的方法主要是“高薪”和“算力管夠”兩條路。業(yè)內(nèi)人士表示,DeepSeek的薪資水平能夠?qū)?biāo)業(yè)內(nèi)任何頂尖機(jī)構(gòu),而且人才如果在字節(jié)跳動(dòng)等取得offer,DeepSeek還會(huì)加碼競(jìng)爭(zhēng)。DeepSeek開出的應(yīng)屆工程師薪酬已經(jīng)等同于業(yè)界同等崗位的“總監(jiān)/經(jīng)理”的薪酬了。
此外梁文鋒非常推崇“極客文化”,在公司內(nèi)部推行扁平化管理,并且鼓勵(lì)員工個(gè)人發(fā)揮潛能進(jìn)行學(xué)習(xí)和創(chuàng)新。DeepSeek也不會(huì)采用互聯(lián)網(wǎng)巨頭常用的“賽馬”機(jī)制,減少團(tuán)隊(duì)內(nèi)耗。在算力資源的調(diào)配上,梁文鋒對(duì)每個(gè)人都不設(shè)上限,只要提出有潛力的思路,他都會(huì)給員工調(diào)撥足夠的資源進(jìn)行嘗試研究。據(jù)悉產(chǎn)生R1模型的技術(shù)思路就是一名年輕員工“突發(fā)奇想”提出的點(diǎn)子,梁文鋒為他搭配了一個(gè)團(tuán)隊(duì),“花了幾個(gè)月時(shí)間才跑通(技術(shù)路線)”。事實(shí)證明,DeepSeek這種“輕經(jīng)驗(yàn)、重潛力”的用人思路,為中國(guó)AI界迎來(lái)了一次劃時(shí)代的創(chuàng)新發(fā)展。
紅星新聞?dòng)浾?鄭直
本文鏈接:http://m.enbeike.cn/news-4-1006-0.html美股震撼、科技巨頭恐慌,95后成群的DeepSeek如何就一夜“破圈”?
聲明:本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請(qǐng)點(diǎn)擊“
”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請(qǐng)點(diǎn)擊“
”按鈕