-
日期: 2025-05-22 | 來源: 硅星人Pro | 有0人參與評論 | 字體: 小 中 大
Claude 4 系列還引入了“工具輔助的延伸思考”、增強的記憶能力以及正式版的編程助手 Claude Code,後者已深度集成至 VS Code 和 JetBrains IDE。在API和MCP的接入等能力上也有大范圍更新。
這是一次全方位的更新,針對編程和推理能力。而這次大更新和工具能力的補足後,Claude 4有了替代人類程序員所需要的所有條件,接下來就是一路提升這些能力,短期目標讓Agents普及,長期就直奔Anthropic眼裡的AGI了。
1
不只是模型升級,更是全面能力補足
Claude 4 的發布,並非簡單沿襲“Haiku、Sonnet、Opus”的階梯式組合,而是推出了兩大核心模型:追求極致性能的 Claude Opus 4 和兼顧效率與成本的 Claude Sonnet 4。
Anthropic 聲稱,Opus 4 是目前編程能力較為領先的模型之一。根據披露信息及早期用戶反饋,它頗有“質變”的意味,不僅編程效率提升,而且其展現出的復雜任務理解和執行能力,讓很多人“feel 到了 AGI”。
顯著提升的代碼生成與理解:Claude Opus 4 在編程基准測試 SWE-bench 上取得了 72.5% 的得分,在 Terminal-bench 上也達到了 43.2%;而 Sonnet 4 在 SWE-bench 上的得分也達到了 72.7%,接近 Opus 4 的水平。
而根據提前試用者的反饋,很多場景已經遠非生成代碼片段或輔助調試,而是能夠理解並處理數百萬行級別的復雜代碼庫,從高度抽象的自然語言需求直接生成結構完整、邏輯嚴密的應用程序框架。
Rakuten 在一項高要求的開源重構任務中,Opus 4 連續穩定運行長達 7 小時,表現出色。Cognition AI 表示,Opus 4 能解決其他模型此前無法完成的復雜任務。這種深度理解和生成能力,是構建更高級智能體的前提。
這些數據和案例表明,Claude 4 不僅僅是代碼片段的生成器,它已經具備了理解大型、復雜項目架構的能力,能夠從高層次的需求出發,生成結構完整、邏輯嚴密的應用程序。這意味著它能夠勝任從需求分析(理解自然語言需求)到代碼實現、重構乃至持續集成等傳統上由人類程序員完成的整個開發生命周期中的核心任務。這種全棧式的代碼處理能力,是替代人類程序員在日常開發工作中所需的第一塊能力。- 新聞來源於其它媒體,內容不代表本站立場!
- 深圳41歲程序員回應"3年不租房睡車裡省10萬"
- 朱媛媛遺作片場照公開!不停咳嗽,瘦到脫相,用厚毛衣裹肚子保暖
- 卡尼與美國談關稅 福特: 下月談攏
- 振龍電器 各類熱銷家電 種類齊全
-
- 54歲"雪姨"王琳榮獲英國黑池舞蹈節第3名
- 距離溫村僅40公裡 兩房屋不超50萬
- 不卷了 UBC女生輟學買老店掙錢去
- 豪華郵輪"海上學府" 邊玩邊游世界
- 神擋殺神 佛擋殺佛 川普殺瘋了 連下狠手
- 經濟出現喜訊 加元飆至七個月高點
-
- WHA世衛通過全球防疫大流行公約 美國表明不奉陪
- 印度控中國向巴提供衛星支援 曝北京反應
- 淡出烏俄和談?川普:不是我的戰爭
- 多倫多地鐵殺人案 中國男子被判終身監禁
- 美國前總統拜登患癌,中文互聯網一片幸災樂禍?
- Condo鎖盒密密麻麻!多倫多這種公寓最難賣
-
- 七旬老人救孫傷人獲刑 改判後申請128萬國家賠償
- 《哪吒2》爆火後,光線傳媒卻遭創始人家族減持,或套現5.38億元!
- 重磅:川普宣布$1750億"黃金穹頂" 中俄痛批
- 溫哥華牙醫診所 提供全面牙科服務
- 維持美國通訊領導地位 川普擬開放拍賣頻譜
- 潛在通脹升 央行6月降息概率下降
-
目前還沒有人發表評論, 大家都在期待您的高見