| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

DeepSeek怎麼賺錢?梁文峰的10萬億美元戰略


請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
我們先來做點有趣的 KV 緩存數學題。別擔心,如果你討厭數學,我們也只是用最近發布的 KV 緩存計算器,來看看 DeepSeek V4 Pro 到底能省下多少 KV 緩存,並把它跟最新的智譜 GLM 和阿裡通義千問(Qwen)模型做個對比。


我以 100 萬(1M)上下文長度為例進行計算,假設 KV 精度為 8 位(8-bit),索引器精度為 16 位(16-bit)。你自己也可以去這個網站上玩玩:https://kvcache.ai/tools/kv-cache-calculator/




在 100 萬上下文深度下:

DeepSeek V4 居然只需要 5.48 GB 的高帶寬內存(HBM, High Bandwidth Memory,一種常用於頂尖 AI 顯卡的高速顯存)。

GLM5 需要 60 GB 的 HBM。

Qwen3-235B-A22B 則需要高達 89 GB 的顯存!

請注意,這還是在以下前提下:

DeepSeek 是一個擁有 1.6 萬億(1.6T)參數的巨無霸模型。


GLM5 大約是 7000 億(700B)參數,而且它已經借鑒了 DeepSeek 的 MLA 和 DSA 技術,只是還沒用上最新的壓縮注意力機制。

Qwen3-235B-A22B 只有 2350 億參數,使用的是相對傳統的 GQA(分組查詢注意力機制)。

DeepSeek 在緩解顯存壓力方面做出了奠基性的貢獻。如果這項創新被行業廣泛采納,將讓那些需要處理超長任務的長程 AI 智能體(Long-horizon Agents)成本低到難以置信,從而徹底解鎖下一代嶄新的應用場景。




瘋狂背後的精密章法

能夠在完全不犧牲模型質量的前提下,把 KV 緩存壓縮得如此之小,正是他們敢把長時緩存(Long-held Cache)價格壓到白菜價的底氣所在——其價格甚至不到 Anthropic 旗下 Claude Sonnet 4.6 緩存命中價格的 3%,而且他們還能幫你免費保留好幾個小時!

對於長程任務來說,由於緩存體量極小,將其“轉存”(Offloading)到固態硬盤(SSD)並在需要時重新加載,就變得極為劃算。這就大大降低了對 HBM 的依賴。要知道,HBM 目前全球嚴重短缺,而且從中國 AI 硬件產業的角度來看,這也是制造難度極高的核心痛點。更絕的是,DeepSeek 還開發了一套能從 SSD 中以極高速度重新加載 KV 緩存的技術,具體細節都在他們的論文裡:https://arxiv.org/pdf/2602.21548


點個贊吧!您的鼓勵讓我們進步     已經有 2 人參與評論了, 我也來說幾句吧
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    共有 2 人參與評論    (其它新聞評論)
    評論1 游客 [愛.能.外.箸] 2026-05-25 03:21
    10萬億美元?蛋糕有那麼大?咋不說60萬億,全球60億人平均每人給他貢獻1萬美元?反正傻貨們不會算賬,吹唄!
    上一頁1下一頁
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0322 秒 and 6 DB Queries in 0.0036 秒