-
日期: 2025-05-22 | 來源: 硅星人Pro | 有0人參與評論 | 字體: 小 中 大
Claude 4 系列還引入了“工具輔助的延伸思考”、增強的記憶能力以及正式版的編程助手 Claude Code,後者已深度集成至 VS Code 和 JetBrains IDE。在API和MCP的接入等能力上也有大范圍更新。
這是一次全方位的更新,針對編程和推理能力。而這次大更新和工具能力的補足後,Claude 4有了替代人類程序員所需要的所有條件,接下來就是一路提升這些能力,短期目標讓Agents普及,長期就直奔Anthropic眼裡的AGI了。
1
不只是模型升級,更是全面能力補足
Claude 4 的發布,並非簡單沿襲“Haiku、Sonnet、Opus”的階梯式組合,而是推出了兩大核心模型:追求極致性能的 Claude Opus 4 和兼顧效率與成本的 Claude Sonnet 4。
Anthropic 聲稱,Opus 4 是目前編程能力較為領先的模型之一。根據披露信息及早期用戶反饋,它頗有“質變”的意味,不僅編程效率提升,而且其展現出的復雜任務理解和執行能力,讓很多人“feel 到了 AGI”。
顯著提升的代碼生成與理解:Claude Opus 4 在編程基准測試 SWE-bench 上取得了 72.5% 的得分,在 Terminal-bench 上也達到了 43.2%;而 Sonnet 4 在 SWE-bench 上的得分也達到了 72.7%,接近 Opus 4 的水平。
而根據提前試用者的反饋,很多場景已經遠非生成代碼片段或輔助調試,而是能夠理解並處理數百萬行級別的復雜代碼庫,從高度抽象的自然語言需求直接生成結構完整、邏輯嚴密的應用程序框架。
Rakuten 在一項高要求的開源重構任務中,Opus 4 連續穩定運行長達 7 小時,表現出色。Cognition AI 表示,Opus 4 能解決其他模型此前無法完成的復雜任務。這種深度理解和生成能力,是構建更高級智能體的前提。
這些數據和案例表明,Claude 4 不僅僅是代碼片段的生成器,它已經具備了理解大型、復雜項目架構的能力,能夠從高層次的需求出發,生成結構完整、邏輯嚴密的應用程序。這意味著它能夠勝任從需求分析(理解自然語言需求)到代碼實現、重構乃至持續集成等傳統上由人類程序員完成的整個開發生命周期中的核心任務。這種全棧式的代碼處理能力,是替代人類程序員在日常開發工作中所需的第一塊能力。- 新聞來源於其它媒體,內容不代表本站立場!
- 深圳41歲程序員回應"3年不租房睡車裡省10萬"
- 溫哥華資深地產經紀 工作誠信認真
- 素裡倆女孩今早結伴上學 下落不明
- 突發!飛機墜落街道燃燒 多人死亡
-
- 通脹數據出爐 加央行6月降息懸了
- 電視劇《開畫少女漫》開播,沈月王敬軒主演,能成校園劇黑馬嗎?
- "卷"不動了 中產選擇移居馬來西亞
- 黃石公園慘劇 遇難中國游客是他們
- 薄熙來和谷開來獄中離婚 兩人同時丟下一句話
- 溫哥華在全球最佳城市排名暴跌!尤其這3項
-
- 唉!溫哥華又被貼上最不想要的標簽
- 特魯多退休福利曝光:養老金近900萬,納稅人埋單
- 路透社:菲律賓總統馬科斯稱願與杜特爾特家族和解
- 馬筱梅發言一句話戳中大S痛點,張蘭樂開花
- 加國慘 財政狀況惡化超其它G7國家
- 罕見使用"清除"一詞,美對中發出強硬信號
-
- 中國出口稀土需填寫最終用戶,進一步封堵漏洞
- NASA:太陽耀斑爆發可能致全球停電
- 與李晨分手6年!范冰冰520罕發聲:還過嗎?
- 俄烏戰爭帶給朝鮮"沸騰"的經濟(圖
- 大溫油價展望 夏季駕車終於輕松了
- 溫哥華牙醫 采用先進技術最新設備
-
目前還沒有人發表評論, 大家都在期待您的高見