56年無人解開的數學難題,被谷歌的新AI突破了

日期: 2025-05-18 | 來源: 極客公園 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小中大
人類對知識的征途，或許才剛剛開始。

去年，AI 能解出博士級別的數學題，已是轟動一時的大新聞；而今年，能攻克「未解之謎」級別的數學難題的 AI 已經來了。

5 月 15 日，Google DeepMind 發布了全新編程智能體 AlphaEvolve。

不同於傳統的編程 Agent，它專注於通用算法的自動發現與持續優化。顧名思義，AlphaEvolve 擅長在「進化」中尋找更優解，它模擬自然選擇機制，能在代碼中不斷迭代、演化出創新算法。

只要問題能用程序表達、結果能用函數評估，AlphaEvolve 就能迭代算法。Google 表示，在組合數學、幾何學、數論等超過 50 個未解問題中應用後，AlphaEvolve 在約 20% 的問題上超越了人類現有解法。

DeepMind 研究員 Matej Balog 表示：「AlphaEvolve 在十多個公開的數學問題上取得了突破。但最讓我激動的是：它找到了 56 年以來，4x4 復數矩陣乘法算法的首次改進。這個結果，來自它自創的一種復雜搜索算法。」

AlphaEvolve 的價值不僅在數學，它展現出的是一種通用的「算法發現能力」。Balog 表示：「我們對 AlphaEvolve 的應用，還只是觸及表層。」

01

問題能用程序表達、結果能用函數評估，

AlphaEvolve 就能迭代算法

Google DeepMind 表示，AlphaEvolve 能夠在多個復雜問題中取得突破，關鍵在於其背後運作的是一整套自動進化機制，能持續優化算法並提升性能。

從本質上看，AlphaEvolve 解決的是一個通用的黑盒優化問題：maximize h(f)。其中，f 是由大型語言模型生成的程序，h 是衡量該程序質量的評估函數。

在實際流程中，AlphaEvolve 首先通過提示采樣器（prompt sampler）組裝提示詞，引導語言模型生成代碼。DeepMind 使用了兩個不同的 Gemini 模型協同工作：Gemini Flash 以更高速度生成大量候選方案，擴展思路的廣度；Gemini Pro 則提供更深入的結構性建議。二者結合，使模型能產出具備實際可行性和算法深度的程序。

生成的程序會被送入自動評估系統，經過驗證、運行和打分後，寫入程序數據庫。數據庫中運行著一套進化算法，會從已有程序中挑選表現最好的方案，為下一輪提示提供方向，不斷迭代出更優解。

AlphaEvolve 的一個核心點就是這套自動評估指標。它能對生成程序進行驗證、運行和評分。每一個程序都會被 h 函數衡量其准確性、運行效率、代碼質量等維度。這些評分標准是客觀、量化的，使 AlphaEvolve 能夠在無需人類直接幹預的前提下持續優化。
- 新聞來源於其它媒體，內容不代表本站立場！

在此頁中閱讀全文
更多谷歌的新聞
分類：科技信息

猜您喜歡

您可能也喜歡

評論

目前還沒有人發表評論, 大家都在期待您的高見

發表評論

視頻

相關功能

加西網新聞