-
日期: 2025-05-23 | 來源: AI范兒 | 有0人參與評論 | 字體: 小 中 大
5月22日,Anthropic在其首屆開發者大會上發布了全新一代的Claude 4系列模型,包括旗艦級的 Opus 4、高性價比的 Sonnet 4,以及效率優先的 Haiku 4,同時推出了 Claude Code 開發工具包。它們背後的目標不再只是“更強大”,而是讓 AI 成為真正“能幹事”的工作搭檔。
而這一次,Claude 不再只是對話模型,它開始接近一個具備自主任務執行能力、跨模態推理能力和高安全保障的 AI 系統雛形。
Claude Opus 4:不僅是更強,而是更“能幹”
Claude Opus 4 是 Anthropic 目前能力最強的模型,甚至在多個維度上超越了 OpenAI Codex-1、o3 和 Gemini 2.5 Pro。
首先是推理深度和持續性。Anthropic 在內部測試中發現,Opus 4 可以在無需人類插手的情況下,連續執行一項編程任務超過 7小時,這對於構建長期自治智能體來說是裡程碑式的進展。對比之下,GPT-4 通常只能持續幾十分鍾。
其次是編碼能力。Opus 4 在代碼基准測試 SWE-bench 中得分高達 72.5%,超過 OpenAI Codex-1(72.1%)和 Gemini 2.5 Pro(63.2%),成為目前已公開測試中 世界最強的代碼大模型。不僅能寫函數、改邏輯,它甚至可以理解跨文件結構,進行結構性重構,具備類似“工程意識”的表現。
圖:Claude 4 模型在 SWE-bench Verified(真實軟件工程任務性能基准測試)上領先
Claude Sonnet 4:高性價比版本,不輸旗艦
如果說 Opus 4 是為了大企業和重度用戶准備的,那 Sonnet 4 則是 Anthropic 為開發者和中小企業提供的“黃金版本”。
Sonnet 4 的 SWE-bench 編碼得分達到 72.7%,甚至略高於 Opus。更重要的是,它在響應速度和成本上做了大量優化,非常適合用於部署到產品工作流中。對於大多數開發者來說,它幾乎能滿足你 90% 的需求。
圖:Claude 4 模型在編碼、推理、多模態能力和代理任務方面表現出色。
Claude 的模型也更加“聽話”了。無論是長指令、結構化輸入,還是格式化輸出,Claude 4 系列在遵循復雜指令方面明顯優於上一代模型,讓它更像一個可靠的助理,而非只會答題的聊天機器人。
Claude Code 工具鏈:讓 AI 真正進開發流程
為了配合 Claude 模型在工程場景的使用,Anthropic 還推出了完整的 Claude Code 工具鏈,包括 CLI 工具、VS Code 插件、GitHub 集成,未來還將開放 JetBrains 插件。
這意味著 Claude 不只是“能寫代碼”,更是“能和你一起工作”。它能識別項目結構、補全單元測試、改動多個文件並解釋修改原因,逐步變成團隊裡那個永遠在線的“萬能實習生”。
引入 AI 安全等級制度,行業首次
當然,模型越強,安全挑戰也越大。Anthropic 在發布會上宣布將 Claude Opus 4 定級為 AI 安全等級 3(ASL-3),是目前公開模型中最高的安全級別。
根據披露,Anthropic 在內部紅隊測試中發現 Opus 4 有能力生成復雜的合成生物設計方案,因而啟動了公司級別的“責任擴展政策”,對模型能力進行限制、追蹤與加密,並上線漏洞賞金計劃與越獄檢測機制。
這也是行業首次以“安全等級”形式管理大模型能力,或許預示著未來的 AI 發布流程會更接近“藥品審查”或“飛行安全評估”。
結語:Claude 4 是 AI 工具進化的分水嶺
過去一年,大模型一路狂飆。但 Claude 4 顯示出一個新的方向:AI 不再是驚艷的 demo,而是可以真正做事、協助開發、承擔部分責任的“工具合伙人”。
Claude 4 的能力不僅是一次迭代,更是對 AI 應用“落地性”的集中體現。它可以處理現實中復雜、多步驟、跨工具的任務,這意味著我們距離“可控、可靠的 AI 員工”又近了一步。
ChatGPT 還在對話,Claude 4 已經加班。- 新聞來源於其它媒體,內容不代表本站立場!
- 美銀警告本周這天才是美股真正分水嶺
- 美中惡斗分水嶺:川普與他們結下兄弟情...
- 卡尼與美國談關稅 福特: 下月談攏
- 不卷了 UBC女生輟學買老店掙錢去
- 鄰居狗吠太吵 投訴2年無果 他放出2條…
-
- 研究:每周3勺這米增加腦損癌風險
- 黃石公園慘劇 遇難中國游客是他們
- 大溫獨立屋出租激增 增速超過公寓
- 美國必須動用所有的工具來打敗中國
- 17萬贓物 當局擬沒收大溫華裔房產
- 蘭裡地產專家 多年蘭裡地產經驗
-
- 馬筱梅發言一句話戳中大S痛點,張蘭樂開花
- 罷免總統:國民黨迎合北京的一場鬧劇
- 加國慘 財政狀況惡化超其它G7國家
- 向習要護照 賀建奎手持美國綠卡公開喊話
- 報告稱大溫4月份公寓銷量下降20%
- 態度"急轉彎"?賴清德將兩岸統一比作"公司並購"
-
- 溫哥華貸款經紀 解決各類疑難貸款
- 反常新聞:李強替代黨魁,習多次缺席重要大會
- 不堪低價沖擊!歐盟擬對中國跨境電商征稅
- 與川普通電話竟談及梅拉尼婭 普京"爆料"
- 印度控中國向巴提供衛星支援 曝北京反應
- 大溫議員:BC應加強市政支出的監督
-
目前還沒有人發表評論, 大家都在期待您的高見