Anthropic发布新一代Claude 3.5模型：全新的Haiku 3.5和升级版Sonnet 3.5

2024年10月22日，Anthropic发布了两个新模型：升级版的Claude 3.5 Sonnet和全新的Claude 3.5 Haiku。升级版的Claude 3.5 Sonnet在保持原有价格和速度的基础上，实现了全面性能提升，尤其在编码领域取得了显著进步。新推出的Claude 3.5 Haiku则以与Claude 3 Haiku相同的成本和类似的速度，在多个评测中达到了与Claude 3 Opus相当的性能水平。

此次发布最引人注目的是Claude 3.5 Sonnet引入了一项突破性的新功能：计算机使用能力（Computer Use）。这项目前处于公测阶段的功能，使Claude能够像人类一样通过观看屏幕、移动光标、点击按钮和输入文本来操作计算机。

升级版Claude 3.5 Sonnet的主要特点

在2024年6月份，Claude发布了Claude Sonnet 3.5模型，该模型相比上一代模型提升明显。Claude模型分为三个版本，最强的是Opus，其次是Sonnet，最小但是最快的是Haiku模型。Sonnet 3.5模型甚至超过了此前的Claude Opus 3模型（即上一代Claude最强的模型）。而四个月后，Sonnet 3.5版本不变，Anthropic给它做了一个升级，目前大家一般称该版本模型为Claude Sonnet 3.5 New。

模型	通过率
Claude 3.5 Sonnet (New)	49.0%
Claude 3.5 Haiku	40.6%
Claude 3.5 Sonnet	33.4%
Claude 3 Opus	22.2%
Claude 3 Haiku	7.2%

模型	零售领域	航空领域
Claude 3.5 Sonnet (New)	69.2%	46.0%
Claude 3.5 Haiku	51.0%	22.8%
Claude 3.5 Sonnet	62.6%	36.0%
Claude 3 Opus	45.1%	34.5%
Claude 3 Haiku	18.2%	16.0%

评测项目	Claude 3.5 Sonnet (New)	Claude 3.5 Sonnet	Claude 3 Opus	GPT-4o	Gemini 1.5 Pro
MMMU (validation)	70.4%	68.3%	59.4%	69.1%	65.9%
MathVista	70.7%	67.7%	50.5%	63.8%	68.1%
AI2D	95.3%	94.7%	88.1%	94.2%	-
ChartQA	90.8%	90.8%	80.8%	85.7%	-
DocVQA	94.2%	95.2%	89.3%	92.8%	-

Anthropic发布新一代Claude 3.5模型：全新的Haiku 3.5和升级版Sonnet 3.5

升级版Claude 3.5 Sonnet的主要特点

DataLearner 官方微信

Claude 3.5 Sonnet的突破性功能：计算机使用能力

工作原理与技术实现

Claude 3.5 Haiku的主要特点

评测结果分析

软件工程与代理任务评测

视觉能力评测

总结

热门博客