-
日期: 2025-05-18 | 來源: 極客公園 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小 中 大
人類對知識的征途,或許才剛剛開始。
去年,AI 能解出博士級別的數學題,已是轟動一時的大新聞;而今年,能攻克「未解之謎」級別的數學難題的 AI 已經來了。
5 月 15 日,Google DeepMind 發布了全新編程智能體 AlphaEvolve。
不同於傳統的編程 Agent,它專注於通用算法的自動發現與持續優化。顧名思義,AlphaEvolve 擅長在「進化」中尋找更優解,它模擬自然選擇機制,能在代碼中不斷迭代、演化出創新算法。
只要問題能用程序表達、結果能用函數評估,AlphaEvolve 就能迭代算法。Google 表示,在組合數學、幾何學、數論等超過 50 個未解問題中應用後,AlphaEvolve 在約 20% 的問題上超越了人類現有解法。
DeepMind 研究員 Matej Balog 表示:「AlphaEvolve 在十多個公開的數學問題上取得了突破。但最讓我激動的是:它找到了 56 年以來,4x4 復數矩陣乘法算法的首次改進。這個結果,來自它自創的一種復雜搜索算法。」
AlphaEvolve 的價值不僅在數學,它展現出的是一種通用的「算法發現能力」。Balog 表示:「我們對 AlphaEvolve 的應用,還只是觸及表層。」
01
問題能用程序表達、結果能用函數評估,
AlphaEvolve 就能迭代算法
Google DeepMind 表示,AlphaEvolve 能夠在多個復雜問題中取得突破,關鍵在於其背後運作的是一整套自動進化機制,能持續優化算法並提升性能。
從本質上看,AlphaEvolve 解決的是一個通用的黑盒優化問題:maximize h(f)。其中,f 是由大型語言模型生成的程序,h 是衡量該程序質量的評估函數。
在實際流程中,AlphaEvolve 首先通過提示采樣器(prompt sampler)組裝提示詞,引導語言模型生成代碼。DeepMind 使用了兩個不同的 Gemini 模型協同工作:Gemini Flash 以更高速度生成大量候選方案,擴展思路的廣度;Gemini Pro 則提供更深入的結構性建議。二者結合,使模型能產出具備實際可行性和算法深度的程序。
生成的程序會被送入自動評估系統,經過驗證、運行和打分後,寫入程序數據庫。數據庫中運行著一套進化算法,會從已有程序中挑選表現最好的方案,為下一輪提示提供方向,不斷迭代出更優解。
AlphaEvolve 的一個核心點就是這套自動評估指標。它能對生成程序進行驗證、運行和評分。每一個程序都會被 h 函數衡量其准確性、運行效率、代碼質量等維度。這些評分標准是客觀、量化的,使 AlphaEvolve 能夠在無需人類直接幹預的前提下持續優化。- 新聞來源於其它媒體,內容不代表本站立場!
- 十年來首次 Google悄悄換新Logo
- 華裔小姐姐名校退學不打工不炒股…低調發財
- 大S死因質疑再升級 瑋琪稱通電話
- 匯錢存GIC被騙慘 溫村女子告銀行
-
- 曝竇驍何超蓮已離婚 男方索分手費
- 溫哥華會計事務所 收費低 服務好
- 長周末上島?BC渡輪船票預訂被搶光
- 植物園舉辦唐頓莊園主題花藝盛會
- 俞灝明結婚官宣,卻讓前女友火了,全網找他前任
- 溫村租客私拿藝術品 法院不讓趕走
-
- 溫哥華牙醫診所 提供全面牙科服務
- 廣東耗資10億豪宅將被強拆 引爆輿論
- 美越貿易談判之際 越南豪送川普集團15億美元
- 新冠再來襲,專家提醒:當前正處於小波峰
- 美中新貿易協議 美國獲5大關鍵成果
- 黃仁勳中東行抱回大單! 股價應聲大漲
-
- 中美休戰暗藏玄機 恐正醞釀大風暴
- 熱帖:2025年最慘的死法就是到杭州?
- 川普訪沙特 這句話引來全場起立致敬
- "美國客戶比我們還急"!中國廠家"電話被打爆"
- 最高近8000 加拿大兒童福利金又漲,馬上到賬
- 大地震要醒?BC南邊24小時接連三震
-
目前還沒有人發表評論, 大家都在期待您的高見