亚洲国产精品一区二区美利坚,一女被多男玩喷潮视频,在线观看免费a∨网站,中文字幕 一区二区三区,亚洲区欧美区综合区自拍区

DeepSeek成功的底層邏輯及產業(yè)影響

6個月前 來源:新華網 觀看:85

仿佛是一夜之間,DeepSeek迎來了“滔天的流量”。它不僅在全球引發(fā)了新一輪的AI應用熱潮,而且給全球的算力資本市場帶來了重大沖擊。究其原因,DeepSeek不僅在訓練成本及使用成本、模型訓練及優(yōu)化方式等領域實現(xiàn)了大量的工程創(chuàng)新,而且打破了AI領域許多的傳統(tǒng)敘事邏輯。簡而言之,DeepSeek正在改變游戲規(guī)則。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek最新推理模型R1的橫空出世,帶來了一個非常大的驚喜,僅用6天就發(fā)展了1億用戶。“用好奇心來揭開AGI的神秘面紗”這一愿景,更增添了神秘色彩。那么,DeepSeek在技術上究竟有哪些創(chuàng)新,成功的背后有哪些深層次的原因?這一切將對中美下一個十年的科技競爭產生哪些影響?KWw即熱新聞——關注每天科技社會生活新變化gihot.com

工程創(chuàng)新KWw即熱新聞——關注每天科技社會生活新變化gihot.com

成就與眾不同KWw即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek不僅引發(fā)了全球新一輪的AI應用熱潮,而且對全球的算力資本市場產生重大沖擊。究其原因,DeepSeek在訓練成本及使用成本、模型訓練及優(yōu)化方式方面均實現(xiàn)了大量工程創(chuàng)新。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

成本是最大的亮點。DeepSeek-R1的整體訓練成本比OpenAI少了一個數(shù)量級以上。R1在整個訓練過程中的工程優(yōu)化和創(chuàng)新亮點非常多,包括“Multi-Head Latent Attention——多頭隱形注意力機制”“Multi-token predication——多token預測”“有選擇性地使用8個浮點數(shù)精度FP8來替代FP16甚至FP31”等。這些優(yōu)化其實都不容易實現(xiàn)。每一個看似不顯著的優(yōu)化,在層級疊加效應下卻產生了非常驚人的效果。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek其實一共發(fā)布了兩個模型,分別是R1和R1-zero。DeepSeek基于V3這個基礎模型聚焦強化學習獲得了R1-zero。但是,R1-zero在回答一些問題的時候容易產生包括“多語言混雜”在內的諸多問題。Deep-Seek又對這個模型進行了SFT(監(jiān)督微調優(yōu)化),從而產生了R1。R1的強化學習功能可以實現(xiàn)自動化,是比較容易去scale的。這樣一來,該模型未來的想象空間接近無限。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

顛覆性改變KWw即熱新聞——關注每天科技社會生活新變化gihot.com

打破傳統(tǒng)敘事邏輯KWw即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek之所以備受關注,本質在于打破了很多AI領域的傳統(tǒng)敘事邏輯,例如OpenAI對于推理模型的算力堆疊霸權邏輯、AI應用圈的OpenAI寡頭壟斷格局邏輯、美國對中國的高制程芯片封鎖邏輯以及AI大模型的開源閉源邏輯……KWw即熱新聞——關注每天科技社會生活新變化gihot.com

首先,AI圈公認這種推理模型的實現(xiàn)難度是極大的。此前,比較好的推理模型只有OpenAI的GPT o1。Anthropic做不出來,Google“卡”了很久才推出表現(xiàn)一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力還要強于o1。進一步來看,R1不僅免費還開源,訓練成本和使用成本均實現(xiàn)了指數(shù)級下降。原先o1憑借領先性可以“收割”相當長一段時間的價值,但DeepSeek-R1的出現(xiàn)以及開源的舉措,讓絕大多數(shù)開發(fā)者以及聚焦應用的創(chuàng)業(yè)公司都能夠以更低的門檻去做開發(fā)。更加便宜且更容易私有化部署的R1,擊碎了華爾街對于所有大模型公司的估值邏輯。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

其次,DeepSeek的出現(xiàn)打破了AI應用圈原有的競爭枷鎖。就算是美國的頂尖應用公司選擇DeepSeek和ChatGPT時,答案也很清楚。Cursor、Perplexity這些AI領域的超級明星應用,都第一時間進行了DeepSeek模型的部署,而且設置了推薦第一優(yōu)先級。此外,Google、Amazon、NV等平臺也都部署了Deep-Seek模型。這些改變,同步影響了云服務的市場格局。國內大量從事應用開發(fā)的企業(yè),在DeepSeek-R1出現(xiàn)之前不得不使用微軟云(為了便捷使用GPT-4的API);現(xiàn)在,使用阿里云上部署的Deep-Seek成為可選項。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

再其次,DeepSeek帶來了芯片封鎖邏輯的崩塌。DeepSeek在輝達CUDA生態(tài)的更底層(例如PTX層),通過微調底層代碼來優(yōu)化性能,從而解決“連接通信能力和調度能力被閹割”的問題。專家普遍認為,目前中美AI大模型領域的技術差距約為4個月。從技術能力發(fā)展的趨勢來看,這一差距繼續(xù)縮小的概率大于擴大的概率。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

最后,開源讓DeepSeek在輿論戰(zhàn)中至少“不落下風”。在AGI的道路上做出最強大的模型并開源,應該是OpenAI最早的初心和使命。市場永遠不會說謊,誰的模型能力強誰就能掌握最終的話語權。2024年12月DeepSeek V3發(fā)布的時候,國際主流媒體主要關注其“成本低廉”;當Deep-Seek-R1發(fā)布時,情況則截然不同,因為“滔天的流量”來了。作為一個開源模型,DeepSeek讓所有用戶在任何領域都增加了一個“頂尖專家”,免費且24小時隨時在線。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

仿佛是一夜之間,DeepSeek迎來了“滔天的流量”。它不僅在全球引發(fā)了新一輪的AI應用熱潮,而且給全球的算力資本市場帶來了重大沖擊。究其原因,DeepSeek不僅在訓練成本及使用成本、模型訓練及優(yōu)化方式等領域實現(xiàn)了大量的工程創(chuàng)新,而且打破了AI領域許多的傳統(tǒng)敘事邏輯。簡而言之,DeepSeek正在改變游戲規(guī)則。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek最新推理模型R1的橫空出世,帶來了一個非常大的驚喜,僅用6天就發(fā)展了1億用戶。“用好奇心來揭開AGI的神秘面紗”這一愿景,更增添了神秘色彩。那么,DeepSeek在技術上究竟有哪些創(chuàng)新,成功的背后有哪些深層次的原因?這一切將對中美下一個十年的科技競爭產生哪些影響?KWw即熱新聞——關注每天科技社會生活新變化gihot.com

工程創(chuàng)新KWw即熱新聞——關注每天科技社會生活新變化gihot.com

成就與眾不同KWw即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek不僅引發(fā)了全球新一輪的AI應用熱潮,而且對全球的算力資本市場產生重大沖擊。究其原因,DeepSeek在訓練成本及使用成本、模型訓練及優(yōu)化方式方面均實現(xiàn)了大量工程創(chuàng)新。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

成本是最大的亮點。DeepSeek-R1的整體訓練成本比OpenAI少了一個數(shù)量級以上。R1在整個訓練過程中的工程優(yōu)化和創(chuàng)新亮點非常多,包括“Multi-Head Latent Attention——多頭隱形注意力機制”“Multi-token predication——多token預測”“有選擇性地使用8個浮點數(shù)精度FP8來替代FP16甚至FP31”等。這些優(yōu)化其實都不容易實現(xiàn)。每一個看似不顯著的優(yōu)化,在層級疊加效應下卻產生了非常驚人的效果。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek其實一共發(fā)布了兩個模型,分別是R1和R1-zero。DeepSeek基于V3這個基礎模型聚焦強化學習獲得了R1-zero。但是,R1-zero在回答一些問題的時候容易產生包括“多語言混雜”在內的諸多問題。Deep-Seek又對這個模型進行了SFT(監(jiān)督微調優(yōu)化),從而產生了R1。R1的強化學習功能可以實現(xiàn)自動化,是比較容易去scale的。這樣一來,該模型未來的想象空間接近無限。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

顛覆性改變KWw即熱新聞——關注每天科技社會生活新變化gihot.com

打破傳統(tǒng)敘事邏輯KWw即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek之所以備受關注,本質在于打破了很多AI領域的傳統(tǒng)敘事邏輯,例如OpenAI對于推理模型的算力堆疊霸權邏輯、AI應用圈的OpenAI寡頭壟斷格局邏輯、美國對中國的高制程芯片封鎖邏輯以及AI大模型的開源閉源邏輯……KWw即熱新聞——關注每天科技社會生活新變化gihot.com

首先,AI圈公認這種推理模型的實現(xiàn)難度是極大的。此前,比較好的推理模型只有OpenAI的GPT o1。Anthropic做不出來,Google“卡”了很久才推出表現(xiàn)一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力還要強于o1。進一步來看,R1不僅免費還開源,訓練成本和使用成本均實現(xiàn)了指數(shù)級下降。原先o1憑借領先性可以“收割”相當長一段時間的價值,但DeepSeek-R1的出現(xiàn)以及開源的舉措,讓絕大多數(shù)開發(fā)者以及聚焦應用的創(chuàng)業(yè)公司都能夠以更低的門檻去做開發(fā)。更加便宜且更容易私有化部署的R1,擊碎了華爾街對于所有大模型公司的估值邏輯。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

其次,DeepSeek的出現(xiàn)打破了AI應用圈原有的競爭枷鎖。就算是美國的頂尖應用公司選擇DeepSeek和ChatGPT時,答案也很清楚。Cursor、Perplexity這些AI領域的超級明星應用,都第一時間進行了DeepSeek模型的部署,而且設置了推薦第一優(yōu)先級。此外,Google、Amazon、NV等平臺也都部署了Deep-Seek模型。這些改變,同步影響了云服務的市場格局。國內大量從事應用開發(fā)的企業(yè),在DeepSeek-R1出現(xiàn)之前不得不使用微軟云(為了便捷使用GPT-4的API);現(xiàn)在,使用阿里云上部署的Deep-Seek成為可選項。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

再其次,DeepSeek帶來了芯片封鎖邏輯的崩塌。DeepSeek在輝達CUDA生態(tài)的更底層(例如PTX層),通過微調底層代碼來優(yōu)化性能,從而解決“連接通信能力和調度能力被閹割”的問題。專家普遍認為,目前中美AI大模型領域的技術差距約為4個月。從技術能力發(fā)展的趨勢來看,這一差距繼續(xù)縮小的概率大于擴大的概率。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

最后,開源讓DeepSeek在輿論戰(zhàn)中至少“不落下風”。在AGI的道路上做出最強大的模型并開源,應該是OpenAI最早的初心和使命。市場永遠不會說謊,誰的模型能力強誰就能掌握最終的話語權。2024年12月DeepSeek V3發(fā)布的時候,國際主流媒體主要關注其“成本低廉”;當Deep-Seek-R1發(fā)布時,情況則截然不同,因為“滔天的流量”來了。作為一個開源模型,DeepSeek讓所有用戶在任何領域都增加了一個“頂尖專家”,免費且24小時隨時在線。KWw即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://m.enbeike.cn/news-2-674-0.htmlDeepSeek成功的底層邏輯及產業(yè)影響

聲明:本網頁內容由互聯(lián)網博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。

上一篇:中央網信辦部署推進2025年信息化重點工作

下一篇:小心AI伴侶背后的“溫柔陷阱”

為你推薦
1月20日有消息稱,據(jù)榮耀內部公告,榮耀中國區(qū)CMO姜海榮將辭去相關職務。據(jù)悉,姜海榮曾在華為與榮耀工作超過20年,歷任研發(fā)、市場等工作...
01-21
  據(jù)國務院國資委8月6日消息,近日,國務院國資委、國家發(fā)展改革委印發(fā)《關于規(guī)范中央企業(yè)采購管...
01-21
  2月6日,記者從2025年全省殘聯(lián)工作會議上獲悉,今年,全省殘聯(lián)系統(tǒng)將更好履行“代表、服務、管理”職責,促...
02-08
    春節(jié)期間,記者走訪市場發(fā)現(xiàn),在黃金熱賣的同時,2025版熊貓金幣也“萌”出圈,以“顏值+保值”...
02-18
  國內首個男性HPV疫苗上市,如何攪動百億市場?國產疫苗有哪些布局?  男性也可以接種HPV疫苗了。  1月18日,默沙東在北京、上海、廣州同時舉行新聞發(fā)布會,宣布四價HPV(人...
01-21
有海的城市,好像會更浪漫些。想象一下,坐在海邊,感受著輕柔的海風,聆聽著海浪拍打礁石的聲音;在海水退潮時,踏入淺灘,翻開一塊塊礁石,尋找...
01-21
到底要不要貼車衣?剛剛入手新車的朋友常常發(fā)出這一疑問。作為保護車漆的第一道防線,車衣,正被越來越多的年輕車主鐘情,他們該省省、該花花,買完新車、就貼車衣,用以保護愛車的車漆...
01-21
1 月 30 日消息,特斯拉CEO埃隆?馬斯克(Elon Musk)在昨天的財報電話會議上表示,特斯拉將于 6 月在美國得克薩斯州奧斯汀推出“無人監(jiān)督、無人駕駛”的 Robotaxi 出租車...
01-31
最近,一部名叫《御飯團》的劇集由幾位杰出的演員出演,播出后受到廣泛關注,收視率和熱度都很高。尤其是關于第98集的分集劇情介紹,在網上引發(fā)了熱烈討論。在第98...
02-20
《六姊妹》為什么叫劉曉玲?劉小玲湯振民結局是什么在電視劇《六姊妹》中,角色叫劉小玲而不姓何,是因為以下原因:出生驚險致母怒:劉小玲是何家老五,她出生時難產,是...
02-20
21世紀經濟報道記者季媛媛 上海報道 2025年剛開始,諾華制藥就完成了大筆收購案。2月11日,諾華宣布了對Anthos Therapeutics的收購計劃。據(jù)...
02-12
21世紀經濟報道記者 韓利明 上海報道“白天還在上班,毫無預兆,下班到家就感覺頭沉、沒食欲,早早便睡下了。可夜里渾身發(fā)冷,頭疼欲裂,吃了布洛芬...
02-13
在一些學校,畢業(yè)后選擇工作的本科生越來越少了。 過去幾周,包括清華大學、北...
01-21
1月18日,澎湃新聞記者注意到,近日華東師范大學官網“學校領導”頁“副校長”...
01-21
  原標題:又見共管保險箱被撬!浙金信托一產品爆雷后被監(jiān)管認定存在四大問題  來源:界面新聞 ...
01-28
  險資在全國的收租版圖有加速拓展的勢頭。近日,新華保險攜手萬科集團旗下住房租賃平臺等,成立...
02-14
雙子男是一個善于交際、機智聰明的星座,他們通常能夠與人輕松相處并保持積極的態(tài)度。然...
01-22
雙子座的男生天性活潑好動,喜歡追求新鮮刺激的感覺。他們往往對愛情持有一種輕松隨意的...
01-22
韓雪服飾品牌? 2020新款雙面羊絨排扣韓版,怎么洗?韓雪服飾品牌?是百適樂品牌,這款產品是全球運動休閑品牌隸屬榮威國際控股有限公司,致力于研發(fā)、生產、銷售高品質和創(chuàng)新的運動休...
02-17
ysl官網怎么退? valentino法國官網?ysl官網怎么退?ysl官網你可以申請退款,然后聯(lián)系下客服,就說想要退,他們會給你一個地址,然后你寄過去就可以了,他們會把錢通過原路返給你的。其實...
02-17
2月6日消息,沃爾瑪加拿大公司近日宣布,將投資65億加元(約45億美元)用于門店和供應鏈的布局與擴張。該計劃包括開設數(shù)十家門店,其中首批五家超級購物中心將于2027年前在安大略省和...
02-07
2月8日消息,淘寶數(shù)據(jù)顯示,由導演餃子創(chuàng)作的哪吒系列形象授權周邊在平臺上銷售額目前已經突破了5000萬。其周邊種類也覆蓋了盲盒、卡牌、毛絨、搪膠娃娃、膠片卡、冰箱貼、徽章...
02-09
2月28日消息,螞蟻集團發(fā)布內部通知,宣布對兩項薪酬政策進行調整,以提升員工薪酬收入的流動性和激勵即時性。根據(jù)通知:17級及以下員工取消年底13薪,改為并入到每月基本工資中發(fā)放;1...
03-01
2月27日消息,智能支付網絡平臺Thunes宣布將其直連的全球網絡(Thunes’ Direct Global Network)擴展至臺灣市場,新舉措將Thunes的Pay-to-Banks銀行支付功能引入該地區(qū),進一步提升...
03-01
自去年底開始,黃金多頭優(yōu)勢逐漸退卻,國際現(xiàn)貨黃金價格經歷幾次大跌后一度跌下2700關口,多空進入漫長的震蕩周期,多頭始終無法找到再度沖高的時機。  北京時間1月21日,國際現(xiàn)貨...
01-24
近日,樸烯晶新能源材料(上海)有限公司(以下簡稱“樸烯晶”)完成數(shù)億元B輪融資。本輪融資由國科東方領投,大零號灣策源基金、尚研莘工基金、民銀國際跟投...
02-07
美少女桌面助理軟件《戰(zhàn)盟桌面精靈》第一個服裝DLC,于2025年1月22日正式上線。此次更新將會為“夏晴”增加一套春節(jié)主題時裝,邀你一同歡慶新年! 巳歲平安,蛇年大...
01-24
《文明7》將于2月11日發(fā)售,近日Firaxis Games公布了游戲新領袖“卑彌呼”。卑彌呼將作為“倭的女王”登場,其特點是擅長科學和外交。官方還發(fā)布卑彌呼宣傳片,一起...
02-03
極目新聞通訊員 李璐“太感謝你們了!這么短的時間,就幫我找回了背包,為我解決了大麻煩!”1月31日上午,張先生來到湖北棗陽市公安局北城派出所領回自己失而復得的背包,緊緊握住民警...
02-02
記者從國家醫(yī)保局獲悉,今年1月,有專家認為某些集采藥品可能存在“血壓不降、麻藥不睡、瀉藥不瀉”質量風險,有關部門派員調研了解情況。日前,參與調研的醫(yī)保、藥監(jiān)部門接受了記...
02-09
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕