您當(dāng)前的位置：中醫(yī)名師網(wǎng) > 快訊

周末DeepSeek扔出“王炸”！首次披露了成本利潤(rùn)率影響多大？

來(lái)源：證券之星閱讀量：19444 時(shí)間：2025-03-02 11:50

導(dǎo)讀周六，國(guó)內(nèi)AI大模型公司DeepSeek官方賬號(hào)在知乎首次發(fā)布《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章，不僅公開(kāi)了其推理系統(tǒng)的核心優(yōu)化方案，更是首次披露了成本利潤(rùn)率等關(guān)鍵數(shù)據(jù)，引發(fā)行業(yè)震動(dòng)。數(shù)據(jù)顯示，若按理論定價(jià)計(jì)算，其單日...

周六，國(guó)內(nèi)AI大模型公司DeepSeek官方賬號(hào)在知乎首次發(fā)布《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章，不僅公開(kāi)了其推理系統(tǒng)的核心優(yōu)化方案，更是首次披露了成本利潤(rùn)率等關(guān)鍵數(shù)據(jù)，引發(fā)行業(yè)震動(dòng)。

數(shù)據(jù)顯示，若按理論定價(jià)計(jì)算，其單日成本利潤(rùn)率高達(dá)545%，這一數(shù)字刷新了全球AI大模型領(lǐng)域的盈利天花板。

業(yè)內(nèi)分析指出，DeepSeek的開(kāi)源策略與成本控制能力正在打破AI領(lǐng)域的資源壟斷。DeepSeek此次透明化披露，不僅展示了其技術(shù)實(shí)力與商業(yè)潛力，更向行業(yè)傳遞明確信號(hào):AI大模型的盈利閉環(huán)已從理想照進(jìn)現(xiàn)實(shí)。

DeepSeek最新發(fā)布

3月1日，DeepSeek于知乎開(kāi)設(shè)官方賬號(hào)，發(fā)布《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章，首次公布模型推理系統(tǒng)優(yōu)化細(xì)節(jié)，并披露成本利潤(rùn)率關(guān)鍵信息。

文章寫(xiě)道:DeepSeek-V3/ R1推理系統(tǒng)的優(yōu)化目標(biāo)是:更大的吞吐，更低的延遲。

為實(shí)現(xiàn)這兩個(gè)目標(biāo)，DeepSeek的方案是使用大規(guī)模跨節(jié)點(diǎn)專(zhuān)家并行，但該方案也增加了系統(tǒng)復(fù)雜性。文章的主要內(nèi)容就是關(guān)于如何使用EP增長(zhǎng)批量大小(batch size)、隱藏傳輸耗時(shí)以及進(jìn)行負(fù)載均衡。

值得注意的是，文章還率先披露了DeepSeek的理論成本和利潤(rùn)率等關(guān)鍵信息。

根據(jù)DeepSeek官方披露，DeepSeek V3和R1的所有服務(wù)均使用H800 GPU，使用和訓(xùn)練一致的精度，即矩陣計(jì)算和dispatch 傳輸采用和訓(xùn)練一致的FP8格式，core-attention計(jì)算和combine傳輸采用和訓(xùn)練一致的BF16，最大程度保證了服務(wù)效果。

另外，由于白天的服務(wù)負(fù)荷高，晚上的服務(wù)負(fù)荷低，因此DeepSeek實(shí)現(xiàn)了一套機(jī)制，在白天負(fù)荷高的時(shí)候，用所有節(jié)點(diǎn)部署推理服務(wù)。晚上負(fù)荷低的時(shí)候，減少推理節(jié)點(diǎn)，以用來(lái)做研究和訓(xùn)練。

在最近24小時(shí)的統(tǒng)計(jì)周期內(nèi):GPU租賃成本按2美元/小時(shí)計(jì)算，日均成本為87072美元；若所有輸入/輸出token按R1定價(jià)(輸入1元/百萬(wàn)token、輸出16元/百萬(wàn)token)計(jì)算，單日收入可達(dá)562027美元，成本利潤(rùn)率高達(dá)545%。

不過(guò)，DeepSeek官方坦言，實(shí)際上沒(méi)有這么多收入，因?yàn)閂3的定價(jià)更低，同時(shí)收費(fèi)服務(wù)只占了一部分，另外夜間還會(huì)有折扣。

DeepSeek的高利潤(rùn)率源于其創(chuàng)新的推理系統(tǒng)設(shè)計(jì)，核心包括大規(guī)模跨節(jié)點(diǎn)專(zhuān)家并行、計(jì)算通信重疊與負(fù)載均衡優(yōu)化三大技術(shù)支柱:專(zhuān)家并行提升吞吐與響應(yīng)速度，針對(duì)模型稀疏性(每層僅激活8/256個(gè)專(zhuān)家)，采用EP策略擴(kuò)展總體批處理規(guī)模(batch size)，確保每個(gè)專(zhuān)家獲得足夠的計(jì)算負(fù)載，顯著提升GPU利用率；部署單元?jiǎng)討B(tài)調(diào)整(如Prefill階段4節(jié)點(diǎn)、Decode階段18節(jié)點(diǎn))，平衡資源分配與任務(wù)需求。

計(jì)算與通信重疊隱藏延遲，Prefill階段通過(guò)雙batch交錯(cuò)實(shí)現(xiàn)計(jì)算與通信并行，Decode階段拆分attention為多級(jí)流水線(xiàn)，最大限度掩蓋通信開(kāi)銷(xiāo)。

全局負(fù)載均衡避免資源浪費(fèi)，針對(duì)不同并行模式設(shè)計(jì)動(dòng)態(tài)負(fù)載均衡器，確保各GPU的計(jì)算量、通信量及KVCache占用均衡，避免節(jié)點(diǎn)空轉(zhuǎn)。

簡(jiǎn)單來(lái)說(shuō)，EP就像是多人協(xié)作，把模型中的專(zhuān)家分散到多張GPU上進(jìn)行計(jì)算，大幅提升Batch Size，榨干GPU算力，同時(shí)專(zhuān)家分散，降低內(nèi)存壓力，更快響應(yīng)。

DeepSeek在工程層面進(jìn)一步壓縮成本。晝夜資源調(diào)配:白天高峰時(shí)段全力支持推理服務(wù)，夜間閑置節(jié)點(diǎn)轉(zhuǎn)用于研發(fā)訓(xùn)練，最大化硬件利用率；緩存命中率達(dá)56.3%:通過(guò)KVCache硬盤(pán)緩存減少重復(fù)計(jì)算，在輸入token中，有3420億個(gè)直接命中緩存，大幅降低算力消耗。

影響多大？

有分析稱(chēng)，DeepSeek此次披露的數(shù)據(jù)，不僅驗(yàn)證了其技術(shù)路線(xiàn)的商業(yè)可行性，更為行業(yè)樹(shù)立了高效盈利的標(biāo)桿:其模型訓(xùn)練成本僅為同類(lèi)產(chǎn)品的1%mdash;5%，此前發(fā)布的DeepSeek-V3模型訓(xùn)練成本僅557.6萬(wàn)美元，遠(yuǎn)低于OpenAI等巨頭；推理定價(jià)優(yōu)勢(shì)方面，DeepSeek-R1的API定價(jià)僅為OpenAI o3-mini的1/7至1/2，低成本策略加速市場(chǎng)滲透。

中信證券認(rèn)為，Deepseek在模型訓(xùn)練成本降低方面的最佳實(shí)踐，料將刺激科技巨頭采用更為經(jīng)濟(jì)的方式加速前沿模型的探索和研究，同時(shí)將使得大量AI應(yīng)用得以解鎖和落地。算法訓(xùn)練帶來(lái)的規(guī)模報(bào)酬遞增效應(yīng)以及單位算力成本降低對(duì)應(yīng)的杰文斯悖論等，均意味著中短期維度科技巨頭繼續(xù)在AI算力領(lǐng)域進(jìn)行持續(xù)、規(guī)模投入仍將是高確定性事件。

本周以來(lái)，DeepSeek開(kāi)啟開(kāi)源周，給人工智能領(lǐng)域扔下數(shù)顆重磅炸彈。回顧DeepSeek這五天開(kāi)源的內(nèi)容，信息量很大，具體來(lái)看:

周一，DeepSeek宣布開(kāi)源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解碼內(nèi)核，并針對(duì)可變長(zhǎng)度序列進(jìn)行了優(yōu)化，現(xiàn)已投入生產(chǎn)；

周二，DeepSeek宣布開(kāi)源DeepEP，即首個(gè)用于MoE模型訓(xùn)練和推理的開(kāi)源EP通信庫(kù)，提供高吞吐量和低延遲的all-to-all GPU內(nèi)核；

周三，DeepSeek宣布開(kāi)源DeepGEMM。其同時(shí)支持密集布局和兩種MoE布局，完全即時(shí)編譯，可為V3/R1模型的訓(xùn)練和推理提供強(qiáng)大支持等；

周四，DeepSeek宣布開(kāi)源Optimized Parallelism Strategies。其主要針對(duì)大規(guī)模模型訓(xùn)練中的效率問(wèn)題；

周五，DeepSeek宣布開(kāi)源Fire-Flyer文件系統(tǒng)，以及基于3FS的數(shù)據(jù)處理框架Smallpond。

因此，有網(wǎng)友評(píng)論稱(chēng):《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章是lsquo;開(kāi)源周彩蛋rsquo;，直接亮出了底牌！

至此，DeepSeek開(kāi)源周的連載或許要告一段落了，但DeepSeek后續(xù)動(dòng)作依然值得持續(xù)關(guān)注。

免責(zé)聲明：該文章系本站轉(zhuǎn)載，旨在為讀者提供更多信息資訊。所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議，僅供讀者參考。

熱文推薦

精選資訊

1 浙江奉化：非遺群龍大巡游

2 打車(chē)福利！128元券包周周領(lǐng)！解

3 “SDGsNEXT”“SDGsN

4 中越東黑冠長(zhǎng)臂猿聯(lián)合保護(hù)行動(dòng)計(jì)劃

5 新春走基層·記者體驗(yàn)360行熱愛(ài)

6 《中國(guó)城市運(yùn)營(yíng)指數(shù)報(bào)告2024》

7 羅氏診斷中國(guó)榮獲2025《商業(yè)周

8 2025漢諾威金屬加工世界EMO

9 中國(guó)兩會(huì)33年履職心系民企劉永好

10 辰山植物園拉開(kāi)春日畫(huà)卷：白玉蘭悄

九九视频只有精品六,18禁男女裸体床震免费,91精品视频在线看

周末DeepSeek扔出“王炸”！首次披露了成本利潤(rùn)率影響多大？

中國(guó)科大發(fā)現(xiàn)一種抗疲勞新策略

消暑熱清心煩試試這兩款養(yǎng)生茶

種植牙想用一輩子？收好“維保”攻略

銀黃含化滴丸和熱炎寧合劑轉(zhuǎn)換為非處方藥

如何巧食粽子讓血糖不飆升？食用指南送給您