欢迎大家来到IT世界,在知识的湖畔探索吧!
代码蜂巢X
探索编程的无限可能
编辑:嘉禾
今天,OpenAI 在 API 平台一次性放出三款新模型:gpt-5 / gpt-5-mini / gpt-5-nano,并同步官宣「这是我们有史以来最会写代码、最会当智能体的模型」。如果你错过了凌晨的发布会,这篇文章 3 分钟带你读懂 GPT-5 到底强在哪、怎么用、要花多少钱。
1. 性能炸裂:写代码直接干到 SOTA
欢迎大家来到IT世界,在知识的湖畔探索吧!
基准测试 |
GPT-5 得分 |
上一代(o3) |
提升 |
|
SWE-bench Verified |
74.9% |
69.1% |
+5.8pp |
|
Aider polyglot |
88% |
约 66% |
错误率↓2/3 |
|
τ2-bench telecom |
96.7% |
<49% |
直接翻倍 |
- 74.9% 的 SWE-bench 成绩,是目前公开榜第一。
- 前端任务 70% 概率优于 o3,审美和细节拿捏更到位。
- 输出 token 数减少 22%,工具调用减少 45%,更快更省。
2. 智能体能力升级:一口气串 10+ 工具不掉链子
- 支持「自定义工具」:用纯文本就能调 API,再也不用写 JSON 转义到头晕。
- 工具调用错误率只有同级别模型的一半。
- 长上下文 400k token(272k 输入 + 128k 输出),128k-256k 区间检索准确率 89%。
- 支持 verbosity 和 reasoning_effort 两个新参数,回答可长可短,推理深度可调。
3. 三大尺寸,按需选择
版本 |
场景 |
价格* |
延迟 |
|
gpt-5 |
全功能旗舰 |
较高 |
中 |
|
gpt-5-mini |
日常编码 |
中 |
快 |
|
gpt-5-nano |
低延迟/边缘 |
低 |
极快 |
4. 真实用户怎么说?
- Cursor:「显著更聪明,人格特质鲜明,极易操控」。
- Windsurf:「工具调用错误率只有别家一半」。
- Manus:「零样本跑复杂智能体任务,无需改代码」。
- Inditex:「答案层层递进,像一位经验丰富的高级工程师」。
5. 3 分钟上手
# 已有 OpenAI CLI 直接升级 pip install -U openai export OPENAI_API_KEY="sk-xxx" openai api chat.completions.create \ -m gpt-5 \ -g "用 Next.js + Tailwind 写一个待办事项应用" \ --reasoning-effort high \ --verbosity high欢迎大家来到IT世界,在知识的湖畔探索吧!
Cursor / Windsurf / Codex CLI 均已默认切换到 GPT-5,无需额外配置,更新客户端即可体验。
6. 安全 & 价格
- 幻觉率比 o3 降低 80%,并在健康、金融等敏感场景做了专项对齐。
- 支持流式输出、结构化返回、批量 API、提示缓存,钱包友好。
- 企业级 SSO、审计日志、私有部署通道已开放申请。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/140184.html