GPT-5现已推出:关于更新的所有信息

GPT-5现已推出:关于更新的所有信息

Robin
6 min read
GPT-5AI AgentOpenAI

OpenAI终于发布了GPT-5系列。深入了解更新的详细信息。AgentX支持GPT-5以增强AI代理。

经过长时间的等待和日益激烈的竞争,OpenAI终于发布了GPT-5系列。据称这是其迄今为止最强大的AI。GPT-5相比早期模型有了很大提升,在编程、数学、写作、健康和图像理解等领域表现更佳。它被构建为一个智能系统,知道何时快速响应,何时需要仔细思考并提供专家级答案。

让我们深入了解这一里程碑式更新的详细信息。


GPT-5有哪些新功能?

很多。以下是最大的突破,提炼如下:

1. 统一模型,无缝体验

不再需要在“ChatGPT-4o”和“Pro reasoning mode”之间进行选择。GPT-5智能地将您的请求路由到正确的后端,将多种功能整合到单一的对话体验中。它就是这么简单。

2. 更聪明,知道自己不知道什么

GPT-5在关键领域的性能有了大幅提升:

  • 数学:AIME得分94.6%

  • 编程:SWE-Bench验证完成率约75%

  • 视觉:视觉推理任务准确率84%

  • 多语言提示:Aider Polyglot得分88%以上

更重要的是,它的幻觉显著减少——在推理时比GPT-4o少45%,比GPT-4-turbo少80%。当它不知道某事时?它更可能告诉你。

3. 更大的记忆,更好的上下文

借助更长的上下文窗口和能够保留您的风格、偏好和过去查询的记忆,GPT-5可以处理更复杂的工作流程而不丢失线索。非常适合长文档、大数据或详细计划。

4. 幻觉率显著降低

以前的大型语言模型(LLMs)最令人沮丧的限制之一是幻觉——AI自信地产生错误或误导性信息。GPT-5改变了这一点:

  • 比GPT-4o少45%的幻觉

  • 在推理任务中比GPT-4-turbo少80%的幻觉

GPT-5不仅更擅长猜测答案——它也更擅长知道自己不知道什么,并且更愿意承认。

5. 更具代理性,少了机械感

GPT-5在执行多步骤指令和使用外部工具方面更出色。它正朝着成为真正意义上的“AI助手”迈进——不仅仅是谈论事情,而是能够为您做事情。与之前的模型相比,它更适合支持AI代理(什么是AI代理?)任务。

6. 工具使用和代理能力

OpenAI一直在稳步推进代理AI——能够自主完成多步骤任务的工具。GPT-5在这方面迈出了重要的一步。

  • 它可以与代码解释器、文件上传器、数据库和API等工具集成。

  • 它在对话中更擅长使用工具——提出后续问题、检查假设和纠正错误。

  • 它支持多步骤工作流程(例如,“分析此PDF,总结内容,并创建幻灯片”)。

无论是在ChatGPT Enterprise还是API集成中,GPT-5使AI更具功能性、更主动、更可靠


API更改

大多数API使用保持不变。然而,一个重要的更新是新的GPT-5系列模型(包括gpt-5、gpt-5-mini、gpt-5-nano和gpt-5-chat)不再支持自定义温度值。开发人员应注意此更改。如果您的API实现中包含自定义温度设置调用GPT-5模型,您可能会遇到错误信息:

openai.BadRequestError: Error code: 400 - {'error': {'message': "Unsupported value: 'temperature' does not support 0.5 with this model. Only the default (1) value is supported.", 'type': 'invalid_request_error', 'param': 'temperature', 'code': 'unsupported_value'}}

GPT-5代币价格

OpenAI降低了GPT-5输入代币的价格,提高了输出代币的价格。

查看输入代币与输出代币之间的价格图表

GPT-5

$1.25

$10.00

GPT-5-mini

$0.25

$2.00

GPT-5-nano

$0.05

$0.40

*gpt-5输入与输出每百万代币的价格

GPT-4.1

$2.00

$8.00

GPT-4.1-mini

$0.40

$1.60

GPT-4.1-nano

$0.10

$0.40

*gpt-4.1输入与输出每百万代币的价格


为什么这很重要

这不仅仅是关于基准测试。GPT-5代表了一种更深层次的设计转变:AI是隐形的、直观的和集成的。您不需要像机器一样思考来使用它。它开始像您一样思考。

这里的比喻不是“更聪明的谷歌”。更像是一个可以编程、设计、总结、研究和可视化的同事——即时的,通常比人类通才更好。一个知道自己何时力不从心的同事。


简而言之

GPT-5是一个里程碑。不是因为它完美——它并不完美。而是因为这是第一次AI模型感觉像是您不需要管理的东西。

您提问。
它思考。
它行动。
如果不能,它会告诉您。
而大多数时候——它只是完成任务。


它如何影响AI代理

AgentX已全面集成并上线最新的OpenAI模型,GPT-5、GPT-5-mini和GPT-5-nano。

您现在可以选择您新的最喜欢的模型来为您的AI代理提供动力。

Ready to hire AI workforces for your business?

Discover how AgentX can automate, streamline, and elevate your business operations with multi-agent workforces.