GPT-5-Pro 评测详情

开启思考

88.40

23 / 175

开启思考工具

89.40

20 / 175

LiveBench

开启思考

78.73

3 / 52

ARC-AGI

开启思考

70.20

27 / 65

开启思考

30.70

64 / 149

开启思考工具

40 / 149

ARC-AGI-2

开启思考

31 / 58

数学推理

共 4 项评测

评测名称 / 模式

得分

排名/总数

开启思考

96.70

19 / 106

开启思考工具

100

1 / 106

常规模式

14.60

23 / 80

开启思考

14.60

23 / 80

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

Simple Bench

开启思考

61.60

4 / 27

与其他模型对比

GPT-5-Pro 评测详情

GPT-5-Pro 当前已收录的代表性评测结果包括 AIME2025（1 / 106，得分 100）、LiveBench（3 / 52，得分 78.73）、GPQA Diamond（20 / 175，得分 89.40）。

评测结果

GPT-5-Pro

评测结果

综合评估

共 7 项评测

评测名称 / 模式

得分

排名/总数

开启思考

88.40

23 / 175

开启思考工具

89.40

20 / 175

LiveBench

开启思考

78.73

3 / 52

ARC-AGI

开启思考

70.20

27 / 65

开启思考

30.70

64 / 149

开启思考工具

40 / 149

ARC-AGI-2

开启思考

31 / 58

数学推理

共 4 项评测

评测名称 / 模式

得分

排名/总数

开启思考

96.70

19 / 106

开启思考工具

100

1 / 106

常规模式

14.60

23 / 80