DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
首页AI 大模型GPT-5 vs GPT-4o(2025-03-27)

GPT-5vsGPT-4o(2025-03-27)

在 3 个共同 benchmark 中,GPT-5 整体领先:GPT-5 领先 2 项,GPT-4o(2025-03-27) 领先 1 项,持平 0 项,平均分差 +14.43。

OpenAI
GPT-5

OpenAI · 2025-08-07 · 基础大模型

OpenAI
GPT-4o(2025-03-27)

OpenAI · 2025-03-27 · 聊天大模型

GPT-52 项(67%)(33%)1 项GPT-4o(2025-03-27)

评测分数

按能力类目分组,每组内按分差大小排列;共 3 项。

综合评估

胶着 2/2
评测项GPT-5GPT-4o(2025-03-27)分差
GPQA Diamond77.8081 / 17566.90121 / 175+10.90
ARC-AGI661 / 658.8060 / 65-2.80

数学推理

GPT-5 领先 1/1
评测项GPT-5GPT-4o(2025-03-27)分差
AIME202561.9080 / 10626.70101 / 106+35.20

规格对比

字段GPT-5GPT-4o(2025-03-27)
发布机构OpenAIOpenAI
发布时间2025-08-072025-03-27
模型类型基础大模型聊天大模型
架构稠密模型稠密模型
参数规模0.00.0
上下文长度400K128K
最大输出1310724096

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项GPT-5GPT-4o(2025-03-27)
文本输入1.25 美元/100 万tokens2.5 美元/100万 tokens
文本输出10 美元/100 万tokens10 美元/100万 tokens

小结

  • GPT-5在以下类目领先:数学推理 (1/1)
  • 胶着类目:综合评估

3 个共同 benchmark 上,GPT-5 平均高出 14.43 分。

单项差距最大的 benchmark:AIME2025 — GPT-5 61.90,GPT-4o(2025-03-27) 26.70(分差 +35.20)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。

GPT-5 详情GPT-4o(2025-03-27) 详情·在工具里自定义对比