【重磅】GPT-5 正式登场：迄今最强“程序员”，已接入 Cursor！

云烟 • 1小时前 • 编程

欢迎大家来到IT世界,在知识的湖畔探索吧!

代码蜂巢X

探索编程的无限可能

编辑：嘉禾

今天，OpenAI 在 API 平台一次性放出三款新模型：gpt-5 / gpt-5-mini / gpt-5-nano，并同步官宣「这是我们有史以来最会写代码、最会当智能体的模型」。如果你错过了凌晨的发布会，这篇文章 3 分钟带你读懂 GPT-5 到底强在哪、怎么用、要花多少钱。

1. 性能炸裂：写代码直接干到 SOTA

欢迎大家来到IT世界,在知识的湖畔探索吧!

基准测试	GPT-5 得分	上一代(o3)	提升
SWE-bench Verified	74.9%	69.1%	+5.8pp
Aider polyglot	88%	约 66%	错误率↓2/3
τ2-bench telecom	96.7%	<49%	直接翻倍

74.9% 的 SWE-bench 成绩，是目前公开榜第一。
前端任务 70% 概率优于 o3，审美和细节拿捏更到位。
输出 token 数减少 22%，工具调用减少 45%，更快更省。

2. 智能体能力升级：一口气串 10+ 工具不掉链子

支持「自定义工具」：用纯文本就能调 API，再也不用写 JSON 转义到头晕。
工具调用错误率只有同级别模型的一半。
长上下文 400k token（272k 输入 + 128k 输出），128k-256k 区间检索准确率 89%。
支持 verbosity 和 reasoning_effort 两个新参数，回答可长可短，推理深度可调。

3. 三大尺寸，按需选择

版本	场景	价格*	延迟
gpt-5	全功能旗舰	较高	中
gpt-5-mini	日常编码	中	快
gpt-5-nano	低延迟/边缘	低	极快

4. 真实用户怎么说？

Cursor：「显著更聪明，人格特质鲜明，极易操控」。
Windsurf：「工具调用错误率只有别家一半」。
Manus：「零样本跑复杂智能体任务，无需改代码」。
Inditex：「答案层层递进，像一位经验丰富的高级工程师」。

5. 3 分钟上手

# 已有 OpenAI CLI 直接升级 pip install -U openai export OPENAI_API_KEY="sk-xxx" openai api chat.completions.create \ -m gpt-5 \ -g "用 Next.js + Tailwind 写一个待办事项应用" \ --reasoning-effort high \ --verbosity high

欢迎大家来到IT世界,在知识的湖畔探索吧!

Cursor / Windsurf / Codex CLI 均已默认切换到 GPT-5，无需额外配置，更新客户端即可体验。

6. 安全 & 价格

幻觉率比 o3 降低 80%，并在健康、金融等敏感场景做了专项对齐。
支持流式输出、结构化返回、批量 API、提示缓存，钱包友好。
企业级 SSO、审计日志、私有部署通道已开放申请。

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://itzsg.com/140184.html