编程能力大幅提升 OpenAI发布GPT-5-Codex

AI快讯1个月前发布 zhuchunguang
0
正文上方广告位
6928acfb18d67a48bebfa36ed8ce47b4

OpenAI发布GPT-5-Codex,一个专门为Agent编程优化的全新模型。

目前,GPT-5-Codex 已通过 Codex 向 ChatGPT Plus、Pro、Business、Edu 与 Enterprise 用户开放,可在终端、IDE、GitHub 或 ChatGPT 中使用。OpenAI 还计划在未来向 API 客户开放该模型。

6e8b3d3c9d419747ad42512289e7b9ab

OpenAI 表示,GPT-5-Codex 的一大改进在于动态计算能力。该模型能够更灵活地分配“思考时间”,在执行代码任务时可能从数秒到长达七小时不等,从而在多项编程基准测试中展现出更优表现。

与此前依靠“路由”机制来预判任务复杂度并分配资源的方式不同,GPT-5-Codex 能在任务进行过程中实时调整所需时间和算力。例如,它可能在开始五分钟后判断需要额外花费一小时,甚至在个别情况下长达七小时。这种机制使其在复杂编程任务上更具优势。

94cad1c8a786c9172fd55441767c09df3ac75741.jpeg@f_auto

根据 OpenAI 数据,GPT-5-Codex 在 SWE-bench Verified 测试以及大型代码库的重构任务中,均优于标准 GPT-5 模型。

此外,该模型还专门接受了代码审查训练,并由资深软件工程师进行评估。结果显示,GPT-5-Codex 的错误更少,同时能提供更多“高影响力的评论”。

OpenAI Codex 产品负责人 Alexander Embiricos 在简报中指出:“GPT-5-Codex 的动态思考能力带来了显著提升。它不依赖固定路由,而是能在任务中途判断需要增加工作时间,这在复杂问题上尤其有优势。”

6a600c338744ebf881e64839c77eae3a6159a7bc.jpeg@f_auto

 

除了GPT-5-Codex外,Greg还爆料了更多内幕。

OpenAI在内部实践中孵化了几款关键工具,帮助团队探索AI编程智能体的潜力。

首先是10x,一款内部原型,最初在终端运行,能显著提高开发效率。

它支持异步长时间执行,工程师甚至可以合上笔记本让任务继续运行,因此被认为带来「十倍生产力」,但因尚未打磨成熟而未对外发布 。

其次是Agents.md,这是一个放在代码库里的说明文件,类似专门写给Codex的README。

它能压缩上下文,减少模型探索代码的负担,同时存放团队的开发偏好(如测试位置、风格约定)。这样 Codex 能更快理解项目环境,执行任务更高效 。

最后是Code ReviewAgent,这是在内部试点后效果最惊艳的工具。

它能理解PR的意图与实现是否一致,检查依赖关系,发现人类审查可能遗漏的bug。

内部团队甚至在上线前一晚依赖它审查数十个PR,并几乎零bug发布。

讨论中也提到,2030年的软件开发将不再是「人写代码+工具辅助」,而是「AI写大部分代码+人类监督和设计架构」。

开发者更像是团队的指挥官,专注于战略性问题和创意设计,而繁琐、重复、危险的工作则由 AI 智能体承担。

收手吧,GPT-5-Codex

现在,编程智能体已经成为各大AI巨头的火力集中点,打得火热!

OpenAI此次发布GPT-5-Codex也是再次「官宣加入战场」。

但是,收手吧,外面已经全是编程智能体了!

让我们盘点一下国内外今年到底有多少编程智能体~

国外通用/主流编程AI智能体

国内代表性产品 /平台

国内在这个赛道加速也非常快,不少大厂都在做「编程智能体\编程模型」的组合,已经有很多专门用于编程的模型和产品。

比如DeepSeek官方公告指出,V3.1在编程智能体和在命令行 / 终端环境下解决复杂任务中表现比之前的 DeepSeek系列模型有明显提升。

总体来看,虽然2025年被称为智能体之年,但主要还是聚焦在编程智能体

国外市场以Cursor、Gemini CLI、Claude Code等为代表,强调模型执行力、重构大上下文处理、IDE/CLI无缝集成等能力。

而国内也同步推出同类型产品对标Cursor和Claude Code等产品。

GPT-5-Codex的上线,让这场「编程智能体大战」更加的白热化!

虽然OpenAI很早就洞察到「语言模型能编程」,但是:

AI编程IDE的认知被Cursor摘取了

AI编程CLI的认知被Claude Code拿到了。

而且国内还同步跟进了各种同类型的产品。

不知道这次起个大早,赶了晚集的GPT-5-Codex能不能拿下「AI智能体编程」的头衔~

© 版权声明
正文底部广告位

相关文章

评论上方广告位