[特朗普] 川普高招果然有用 DeepSeek新模型難產
美國4月起限制輝達H20高階芯片出口至中國,據信有效阻止DeepSeek發展,即將問世的最新R2模型難產,推出遙遙無期,近期恐難打入市場。
外媒《The Information》報道,知情人士透露DeepSeek(深度求索)即將推出最新模型R2,不過由於執行長梁文鋒仍對表現不滿意,將調整優化至梁文鋒認可後才會放行,日期未定。
報道指出,就算R2發布後的表現優於其他開源模型,中國雲端服務供應商恐怕也無法應付客戶需求,主因在於客戶目前多半是透過雲端上部署的輝達(NVIDIA)降規版AI芯片H20來運行上一代模型R1,但這些雲端服務供應商正面臨輝達芯片日益短缺問題。
報道指出,在美國一步步收緊對AI芯片的出口限制下,DeepSeek以相對受限的運算資源實現模型效率、R1模型年初推出後掀起外界對中國技術突破重圍的討論,但是美國4月針對輝達H20芯片祭出出口管制的效果正在發酵,凸顯中國仍高度依賴美國技術。
R1發布後,中國雲端服務供應商、開發者、國營企業、政府機構競相使用,這款模型以輝達的硬體和軟體進行訓練,在輝達芯片上運行表現最好,使R1和H20成了絕配。

為滿足需求,阿裡巴巴、字節跳動、騰訊等中國企業今年前3個月訂了約120萬顆、總值高達160億美元(約4800億新台幣)的H20芯片;不過,美國出口管制粉碎了中國企業想要囤積更多H20的希望。輝達執行長黃仁勳曾表示須認列高達55億美元損失。
據中國雲端服務供應商員工的說法,DeepSeek和中國企業保持著聯系、提供技術規格以協助企業規劃如何使用即將發布的R2模型,包含須“准備足夠數量的H20芯片”。
根據中央社,中國企業目前僅能仰賴現有的H20庫存,這將限縮R2的使用。盡管華為和中國其他芯片商提供了輝達芯片的替代方案,但由於輝達芯片和DeepSeek模型的相容性,中國雲端服務供應商若改用中國制芯片,不僅模型效率會降低,管理上也將更為不易。
覺得新聞不錯,請點個贊吧
還沒人說話啊,我想來說幾句
川普果然高瞻遠矚!外媒《The Information》報道,知情人士透露DeepSeek(深度求索)即將推出最新模型R2,不過由於執行長梁文鋒仍對表現不滿意,將調整優化至梁文鋒認可後才會放行,日期未定。
報道指出,就算R2發布後的表現優於其他開源模型,中國雲端服務供應商恐怕也無法應付客戶需求,主因在於客戶目前多半是透過雲端上部署的輝達(NVIDIA)降規版AI芯片H20來運行上一代模型R1,但這些雲端服務供應商正面臨輝達芯片日益短缺問題。
報道指出,在美國一步步收緊對AI芯片的出口限制下,DeepSeek以相對受限的運算資源實現模型效率、R1模型年初推出後掀起外界對中國技術突破重圍的討論,但是美國4月針對輝達H20芯片祭出出口管制的效果正在發酵,凸顯中國仍高度依賴美國技術。
R1發布後,中國雲端服務供應商、開發者、國營企業、政府機構競相使用,這款模型以輝達的硬體和軟體進行訓練,在輝達芯片上運行表現最好,使R1和H20成了絕配。

為滿足需求,阿裡巴巴、字節跳動、騰訊等中國企業今年前3個月訂了約120萬顆、總值高達160億美元(約4800億新台幣)的H20芯片;不過,美國出口管制粉碎了中國企業想要囤積更多H20的希望。輝達執行長黃仁勳曾表示須認列高達55億美元損失。
據中國雲端服務供應商員工的說法,DeepSeek和中國企業保持著聯系、提供技術規格以協助企業規劃如何使用即將發布的R2模型,包含須“准備足夠數量的H20芯片”。
根據中央社,中國企業目前僅能仰賴現有的H20庫存,這將限縮R2的使用。盡管華為和中國其他芯片商提供了輝達芯片的替代方案,但由於輝達芯片和DeepSeek模型的相容性,中國雲端服務供應商若改用中國制芯片,不僅模型效率會降低,管理上也將更為不易。


分享: |
注: |