| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

劉潤:下一個萬億機會,正在出現(圖

QR Code
請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
如何做到呢?答案之一,或許就是:強化學習







9年後,愛因斯坦級別的AI要來了?

OpenAI的Dan Roberts說,或許:9年後,模型就能獨立發現廣義相對論級別的成果。

9年後。愛因斯坦級別的AI。這太誇張了。

憑什麼這麼說?

這要從ChatGPT發布的幾個模型說起。從4o模型,到o1,再到o3。他們的推理能力,表現得越來越好。o3,能在1分鍾的時間內,完成Dan Roberts要花3小時才能計算出來的物理問題。


為什麼會這樣?

Dan Roberts認為,答案可能是:強化學習

如果說預訓練,是讓AI模型通過“提前預習”,學到了海量知識,那麼強化學習,就是讓AI在不斷的實踐、試錯和獲得反饋中,自己摸索出解決問題的方法。4o模型,幾乎全部是預訓練計算。o1裡,有了那麼一些強化學習計算。o3裡,強化計算的占比進一步增加了。




所以未來,Open AI,打算繼續加碼強化學習

他們相信,強化學習,是讓AI從“博學的學生”,進化為能夠獨立思考、主動探索的“研究員”的關鍵路徑。

以前,大家覺得強化學習,只是預訓練這個大蛋糕上的一顆小櫻桃,但OpenAI,打算用“巨大的強化學習櫻桃”,壓垮整個蛋糕。


您的點贊是對我們的鼓勵     無評論不新聞,發表一下您的意見吧
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0389 秒 and 5 DB Queries in 0.0073 秒