前面提到Anthropic发布Opus 4.6的时候,OpenAI同一天也搞了大动作,推出了“迄今最强编程代理”GPT-5.3-Codex,说白了,这就是一场针对企业市场的“AI大战”,只是这场大战很少被大众关注,大多人只知道“又出了新AI”,却不知道背后的竞争有多激烈,还有很多实用细节值得唠唠。

和Opus 4.6主打金融分析不同,GPT-5.3-Codex专门主攻编程领域,而且实力非常能打——在真实的软件工程评测SWE-Bench Pro上,它拿到了57%的成绩,在终端操作能力测试中,得分77.3%,比Opus 4.6的65.4%高出不少,而且完成同等任务,需要的算力更少,推理速度也比上一代提升了25%,效率大幅提升。

还有一个大众几乎不知道的里程碑细节,GPT-5.3-Codex是OpenAI首个“参与自身创建”的模型,研发团队用它的早期版本,完成了训练调试、部署管理和结果诊断,相当于AI自己“参与”了自己的诞生,这也意味着AI的自主能力又上了一个新台阶。

而且OpenAI的野心不止于编程,它想把这个模型打造成“全能办公助手”,不只是写代码、查bug,还能帮开发者撰写文档、做用户研究、分析数据,甚至能完成专业人士在电脑上的大部分任务,目标就是抢占企业生产力软件市场,和Anthropic、微软正面抗衡,后续AI圈的竞争,只会越来越激烈,我们普通人也能慢慢感受到这些AI带来的工作变化。

© 版权声明
分享是一种美德,转载请保留原链接