-
日期: 2025-01-27 | 來源: ETtoday | 有0人參與評論 | 字體: 小 中 大
(取自App Store)
(北京27日訊)中國AI新創公司DeepSeek近期接連發表兩款大模型,還沖上了美國APP Store免費APP下載排行榜的第一名,受到大量關注。
中媒《澎湃新聞》指出,DeepSeek-R1憑著“物美價廉”引起轟動,費用比OpenAI o1便宜九成,並有著不俗的性能表現。
報道提到,DeepSeek於20日正式發表推理大模型DeepSeek-R1,作為一款開源模型,R1在數學、代碼、自然語言推理等任務上的性能能夠比肩OpenAI o1模型正式版,並采用MIT許可協議,支持免費商用、任意修改和衍生開發等。
據DeepSeek介紹,R1的預訓練費用只有557.6萬美元,在2048塊英偉達H800 GPU(針對中國市場的低配版GPU)集群上運行55天完成,只要OpenAI GPT-4o模型訓練成本的不到十分之一。
DeepSeek表示,R1在後訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。
同時,DeepSeek不只將R1訓練技術全部公開,還蒸餾了6個小模型向社區開源,允許用戶借此訓練其他模型。
DeepSeek-R1憑其“物美價廉”的特性在開發者社群中受到關注,在API定價方面,DeepSeek R1服務對每百萬輸入token收取0.55美元,對每百萬輸出token收取2.19美元/百萬,而OpenAI最新版o1模型的相應收費分別為15美元/百萬和60美元/百萬。
小有名氣的研究者Shubham Saboo表示,作為一款100%開源的模型,R1比OpenAI o1便宜96.4%,同時提供類似的性能,建議已經訂閱ChatGPT的開發者“放棄沉沒成本”。
英偉達高級研究科學家Jim Fan表示,DeepSeek-R1可能是“首個展示了RL(強化學習)飛輪可以發揮作用且能帶來持續增長的OSS(開源軟件)項目”,其中,“飛輪”用來形容AI系統中自我強化、正向循環的過程。
DeepSeek的論文顯示,不同於過去AI模型往往依賴於監督微調(SFT,指AI模型通過已標注的數據進行訓練),R1完全由強化學習驅動,證明直接強化學習是可行的。
Jim Fan指出,“我們正處於一個奇特的時間線上,一家非美國公司正在踐行OpenAI最初的使命,即實現真正開放的前沿研究並讓所有人受益。這種情況簡直無法理解。最有娛樂性的結果卻是可能性最大的結果。”
中國360創辦人周鴻禕更表示,DeepSeek這家公司最近的表現簡直逆天,相信將來如果要對抗美國的AI技術霸權,中國大模型技術復仇者聯盟戰隊裡一定有DeepSeek的一份,“因為這家公司和它的創始人非常低調,他們技術能力和未來前景被市場嚴重低估了。”
新聞來源:ETtoday- 新聞來源於其它媒體,內容不代表本站立場!
- 智慧手表市占排行榜變天 黑馬銷量翻倍
- 12生肖智商排行榜出爐 鼠排第二
- 京東回應"劉強東疑登騎手排行榜第一"
- 《士兵突擊》我最喜歡的角色排行榜,在他面前,史今只能排第二
- 溫哥華匯款/外幣兌換 匯率最優安全
- 大溫新公寓市場目前情況 一定要知
-
- 正午陽光出品的10大巔峰劇,《琅琊榜》僅排第三,榜首實至名歸
- 高風險時期!大溫長周末遠足要小心
- 中國游客瘋狂打卡 理由比節目荒誕
- 溫哥華以北 這種花盛放春天才開始
- 交27萬元這費用 大溫公寓業主嚇醒
- 美國小哥海底撈被服務驚呆 無小費
-
- 慘!過敏季開始更早 更猛 持續更久
- 最高近8000 加拿大兒童福利金又漲,馬上到賬
- 溫哥華牙醫 采用先進技術最新設備
- 何清漣:川普關稅戰確實贏了 最大贏點是…
- 交易詭才:在中東,看到了川普的偉大
- 雨天還開飛車?溫村汽車翻了底朝天
-
- "美國客戶比我們還急"!中國廠家"電話被打爆"
- 熱帖:2025年最慘的死法就是到杭州?
- 卡尼"跪"了:對美關稅近"清零" 全網怒轟
- 葉童,有著張揚的生命力和灑脫的帥性,乘風破浪正當時 | 二湘空間
- 新冠再來襲,專家提醒:當前正處於小波峰
- 震驚加國 這黨領導人去年花883萬
-
目前還沒有人發表評論, 大家都在期待您的高見