GPT

GPT-5.2 来了! OpenAI 认为它是超越人类专家的最强大的编码代理。奥特曼预计“红色警报”状态将于明年一月解除。
2025 年 12 月 12 日 07:46
每日经济新闻
编辑|杜宇
12月11日,美国开放人工智能研究中心(OpenAI)发布了GPT人工智能模型的最新改进版本GPT-5.2,以满足生成式人工智能领域日益激烈的竞争。
图片来源:OpenAI官网
继谷歌11月推出的Gemini 3 AI模型表现强劲后,OepnAI首席执行官Sam Altman近日发布“红色警报”,加速发布GPT改进版本。
继今年 8 月发布 GPT-5 后,OpenAI 于 11 月发布了改进版本 GPT-5.1,时隔不到一个月再次更新。业内认为,此举凸显了AI行业目前面临的竞争压力。
图片来源:视觉中国
GPT-5.2是OpenAI迄今为止最先进的人工智能(AI)模型。针对专业工作场景进行全面优化,并在多项基准测试中创下行业记录。其中,GPT-5.2 Thinking创下了SWE编码能力测试历史上的新纪录。这也是第一个性能达到或超过人类专家水平的OpenAI模型。
OpenAI 表示,GPT-5.2 是迄今为止针对“知识任务”表现最好的模型系列。OpenAI 研究副总裁 Adain Clark 表示,GPT-5.2 在数学推理方面的进步意味着它可以更好地处理金融建模、预测和数据分析等任务。
OpenAI宣布GPT 5.2将于12月11日在ChatGPT上发布,提供三个版本:Instant、Thinking和Pro,供付费用户使用软件包包括 Plus、Pro、Go、Business 和 Enterprise。 API也同时向所有开发者开放。
ChatGPT 允许付费用户使用三个版本的 GPT-5.2,并在接下来的三个月内继续使用 GPT-5.1。在 API 平台上,GPT-5.2 的定价为每百万个 intrada 代币 1.75 美元,每百万个输出代币 14 美元,缓存条目有资格享受 90% 的折扣。尽管 OpenAI 的单币价格比 GPT-5.1 更高,但由于模型效率更高,达到相同质量水平的总成本更低。
OpenAI单独介绍,Instant是一款快速高效的日常工作和学习助手,在信息查询、操作指南、技术文档和翻译等方面都有显着改进,延续了GPT-5.1 Instant更加友好的对话风格。特别是早期测试人员发现,GPT-5.2 的说明更加清晰,并且直接呈现了重要信息。
专为深度工作而设计,思考可以帮助用户更高效地完成更复杂的任务。它对于编码、总结长文档、回答有关上传文件的问题、执行逐步数学和逻辑运算以及以更清晰的框架和更有用的细节支持规划和决策特别有用。
当您需要针对棘手问题提供高质量答案时,Pro 是“更智能、更可靠”的选择。早期测试显示在编程等复杂领域有更好的性能,并且主要错误更少。
GPT-5.2支持多项主要功能,打破了基准测试的行业记录。在GDPval测试中,模型在覆盖44个职业的知识工作任务上,70.9%的表现达到或超过行业专家的水平。 OpenAI 声称,GPT-5.2 Thinking 可以比专家快 11 倍且成本不到 1% 地完成这些任务。
在编码熟练度方面,GPT-5.2 Thinking 在 SWE-Bench Pro 中取得了 55.6% 的成绩,在 SWE-Bench Pro 中取得了 80% 的新高分。SWE 工作台已验证。该基准测试使用四种编程语言测试真实世界的软件工程技能。 OpenAI 产品主管 Max Schwarzer 表示,GPT-5.2 代表了代码生成和调试方面的重大进步,Windsurf 和 CharlieCode 等编码初创公司报告称,该模型实现了“最先进的代理编码性能”。
OpenAI 声称 GPT-5.2 Thinking 是“世界上最好的视觉模型”,在图形推理和理解软件界面方面的错误率约为一半。该模型是第一个在 OpenAI MRCRv2 测试的 256,000 个 token 内实现近 100% 长文本处理准确率的模型,使其特别适合深度文档分析和多源信息工作流程。
在科学研究领域,GPT-5.2 Pro在GPQA Diamond测试中取得了93.2%的准确率,其次是GPT-5.2 Thinking,达到了92.4%。在 FrontierMath 专家级数学测试中,GPT-5.2 Thinking 解决了 40.3% 的问题s,创下新纪录。 OpenAI 将 GPT-5.2 Pro 和 GPT-5.2 Thinking 称为“世界上最好的科学辅助模型”。
作为我对谷歌的反击,GPT-5.2只是“第一击”。
CEO奥特曼12月11日宣布,公司将于下周向用户赠送“圣诞小礼物”。他表示,Gemini 3 对公司各项指标的影响没有最初担心的那么大。他还表示,OpenAI 预计将于 2026 年 1 月摆脱当前的红色警报状态,“处于非常有利的地位”。
OpenAI首席产品官Fiji Simo也在12月11日宣布,该公司已开始在部分地区推出年龄估计系统。该措施旨在控制 ChatGPT 对用户的响应内容。18 岁以下的用户。 Simo还表示,该公司希望在明年第一季度推出“成人模式”之前推出这一功能。
此前有报道称OpenAI正计划推出新模型next 1月份拥有更好的图像处理能力和更全面的定制功能,但该公司周四并未证实这一传闻。
每日经济新闻一般公共关系。
新浪财经公众号
我们每天24小时播放最新的财经新闻和视频。更多粉丝福利,请扫描二维码关注我们(新浪财经)