-
日期: 2025-05-17 | 來源: 智東西 | 有0人參與評論 | 字體: 小 中 大
Codex可並行處理多項任務,例如編程、解答代碼庫相關問題、修復錯誤以及提交拉取請求以供審核等,在雲上運行並預加載用戶代碼庫。
Codex由codex-1模型提供支持。codex-1是OpenAI o3針對軟件工程優化後的版本。目前,Codex已面向ChatGPT Pro、Team和Enterprise用戶上線,即將面向Plus用戶上線。
OpenAI同步推出codex-1的精簡版本,基於o4-mini專為輕量級開源編碼Agent“Codex CLI”而打造,API定價為1.5美元/100萬 tokens輸入, 6美元/100萬tokens輸出,即時緩存打七五折。
體驗地址:https://chatgpt.com/codex
01.自己寫代碼提交更改 跑一次1-30分鍾
現在,用戶可以通過ChatGPT的側邊欄訪問Codex,通過輸入提示並點擊“代碼(Code)”按鈕下達編程任務,也可以點擊“Ask(提問)”向Codex詢問有關代碼庫的問題。每個任務都在預加載了用戶代碼庫的獨立隔離環境中獨立處理。
Codex可以讀取和編輯文件,以及運行包括測試工具、類型檢查器等在內的命令。任務完成通常需要1-30分鍾,具體取決於復雜程度,用戶可以實時監控Codex的進度。
Codex完成任務後,會在其環境中提交更改。通過引用終端日志和測試輸出,Codex來提供其操作的可驗證證據,讓用戶可以追蹤任務完成過程中的每個步驟。
用戶可以查看結果、請求進一步修訂、提交GitHub拉取請求,或直接將更改集成到本地環境中。在產品中,用戶可以配置Codex環境,使其盡可能與實際開發環境匹配。
Codex可以通過放置在用戶代碼庫中的AGENTS.md文件進行引導。這些文本文件類似於README.md,用戶可以在其中告知Codex如何導航代碼庫、運行哪些命令進行測試以及如何最好地遵循項目的標准實踐。與人類開發人員一樣,Codex在配置好開發環境、可靠的測試設置和清晰的文檔後,性能最佳。
在編碼評估和內部基准測試中,即使沒有AGENTS.md文件或自定義代碼生成器,codex-1也表現出強勁的性能。
23個無法在OpenAI內部基礎架構上運行的SWE-Bench Verified樣本被排除在外。codex-1的測試設置最大上下文長度為192k tokens,推理難度為中等,這也是目前產品中可用的設置。
02. 報錯自動告知用戶,過程可檢測
在安全和透明度方面,用戶可以通過引用、終端日志和測試結果來檢查Codex的工作。
當不確定或面臨測試失敗時,Codex會明確地告知這些問題,使用戶能夠就如何繼續進行做出正確決策。
訓練codex-1的主要目標,是讓它的輸出與人類的編程偏好和標准更接近。
如下圖所示,與OpenAI o3模型相比,codex-1始終能夠生成更清晰的補丁,可供立即進行人工審核並集成到標准工作流程中。
為了平衡安全性和實用性,Codex經過了訓練,能夠識別並精准拒絕旨在開發惡意軟件的請求,同時清晰區分並支持合法任務;還增強了政策框架,並納入了嚴格的安全評估。
Codex完全在雲端安全隔離的容器中運行。
在任務執行期間,互聯網訪問被禁用,Agent的交互僅限於通過GitHub代碼庫明確提供的代碼以及用戶通過安裝腳本配置的預安裝項。Agent無法訪問外部網站、API或其他服務。
03. Pro用戶可免費體驗 API收費1.5美元/100萬 tokens輸入
上個月,我們推出了Codex CLI,一款在終端中運行的輕量級開源編碼Agent。它將o3和o4-mini等模型功能引入到用戶的本地工作流程中。
今天,OpenAI還發布了codex-1的精簡版本,這是專為Codex CLI使用而設計的o4-mini版本。
這個新模型支持CLI中更快的工作流程,並針對低延遲代碼問答和編輯進行了優化,同時保留了指令遵循和樣式方面的相同優勢。它現在是Codex CLI中的默認模型,並在API中以codex-mini-latest的形式提供。
使用ChatGPT登錄Codex CLI的Plus和Pro用戶,今天晚些時候即可開始兌換價值5美元和50美元的免費API積分,有效期為30天。
對於使用codex-mini-latest構建的開發人員,該模型可在Responses API上使用,價格為1.5美元/100萬 tokens(輸入), 6美元/100萬 tokens(輸出),享受75%的即時緩存折扣。
OpenAI的技術團隊已開始將Codex納入其日常工具包。
工程師們最常使用它來卸載那些重復且范圍明確的任務,例如重構、重命名和編寫測試。它同樣適用於構建新功能、連接組件、修復錯誤以及起草文檔。
在發布之前,OpenAI還與一小群外部測試人員合作。
比如,思科正在探索Codex如何幫助其工程團隊更快地將想法付諸實踐,並向OpenAI團隊提供反饋;Temporal使用Codex加速功能開發、調試問題、編寫和執行測試以及重構大型代碼庫等。
根據早期經驗,OpenAI建議同時將范圍明確的任務分配給多個Agent,並嘗試不同類型的任務和提示,以有效地探索模型的功能。
04. 結語:Codex仍處早期階段 未來或成主流
OpenAI坦言,Codex的開發仍處於早期階段。作為研究預覽版,它目前缺少一些功能,例如用於前端工作的圖像輸入,以及在Agent工作時對其進行方向修正的功能。此外委托給遠程Agent比交互式編輯耗時更長,都需要時間改進。
這僅僅是一個開始,可以預測,Codex在ChatGPT中引入的異步多Agent工作流將成為工程師編寫高質量代碼的主流方式,實時配對和任務委托兩種交互模式將逐漸融合。- 新聞來源於其它媒體,內容不代表本站立場!
- 深圳41歲程序員回應"3年不租房睡車裡省10萬"
- 溫哥華資深地產經紀 工作誠信認真
- BC男子中50萬 稱像釣上一條大鱒魚
- 鳳姐近況罕曝光:40歲身材臃腫 牙齒脫落
-
- 租房給這種人 加拿大最冤種的房東
- 大溫網紅瀑布徒步 18歲少年失蹤
- "沒拿40億",甘薇宣布和賈躍亭離婚,中國第一大忽悠下周回國嗎
- 王安宇又賭對了!陷入我們的熱戀預告"炸鍋",謀女郎出場質量棒
- 家中藏2億現金,祖墳挖出3公斤金磚?官員被曝...
- 巨人網絡史玉柱,一個被兄弟們坑慘的老男人!
-
- 20年來加國暑期就業從未如此糟糕
- 罷免總統:國民黨迎合北京的一場鬧劇
- 有利買家 加拿大房價正進入調整期
- 美國前總統拜登患癌,中文互聯網一片幸災樂禍?
- 大溫議員:BC應加強市政支出的監督
- 大溫公交客流量暴漲 竟超過了大多
-
- 俄烏戰爭帶給朝鮮"沸騰"的經濟(圖
- 突發!加國郵政周五開始撂擔子罷工
- 與川普通電話竟談及梅拉尼婭 普京"爆料"
- 川普"大而美"的稅收法案 加劇美債擔憂
- 報告呼吁對大溫治理進行重大改革
- 溫哥華地產經紀 經驗豐富誠信可靠
-
目前還沒有人發表評論, 大家都在期待您的高見