Anthropic发布“模拟计算机访问”及全新 Claude 3.5 Sonnet 和 Haiku

发表于 2024-10-23

标记狮私有云部署

一键部署标记狮至私有服务器，构建快速，安全，高效，私密的UI设计团队云协作

Anthropic发布“模拟计算机访问”及全新 Claude 3.5 Sonnet 和 Haiku_2.jpg

10月22日，Anthropic 再次引爆了我们的期待，Claude 3.5 Sonnet 和 Claude 3.5 Haiku 的发布，让人们看到 AI 编程的未来正以超乎预期的速度到来。

这两款模型不仅在编程能力上大幅提升，还通过一个令人激动的新功能——“模拟计算机访问”，让我们真正看到了 AI 模型模拟人类操作电脑的无限可能。

1. “模拟计算机访问”

如果说 Claude 3.5 系列有什么真正让人耳目一新的功能，那一定是“模拟计算机访问”。通过这个功能，Claude 不再只是一个静态的工具，而是能够像人类一样操作电脑。是的，你没有听错！Claude 可以打开文件、点击按钮、输入文本，甚至执行复杂的多步骤任务。

开发人员可以通过 API控制 Claude指示 Claude 自动填写表格、浏览网页，甚至完成软件测试等繁琐的任务。

虽然这项技术还在不断完善中，但其潜力已经让人无比期待。在 OSWorld 测试中，Claude 在依靠截图操作的任务中得分达到 14.9%，领先于其他 AI 系统。

目前已在Claude 3.5 Sonnet公测版中提供该功能。

Anthropic发布“模拟计算机访问”及全新 Claude 3.5 Sonnet 和 Haiku_3.jpg

2. Claude 3.5 Sonnet

Claude 3.5 Sonnet 是 Anthropic 目前最为强大的编程 AI，Sonnet 在编码任务中的表现十分亮眼，尤其是在 SWE-bench 测试中，它的得分从 33.4% 一跃提升至 49.0%，超越了所有同类 AI 模型。

对于那些日常需要频繁处理复杂编码任务的开发者来说，Sonnet 如同一双“加速的翅膀”。从 DevOps 的自动化操作到开发环境中的安全监控，Sonnet 都展现出了卓越的处理能力。

3. Claude 3.5 Haiku

如果你正在寻找性价比高，同时又不牺牲速度的 AI 模型，那么 Claude 3.5 Haiku 绝对是你的不二选择。Haiku 保持了上一代的低延迟和高效能，但在性能上实现了质的飞跃。

在 SWE-bench 测试中，Haiku 的得分达到了 40.6%，超过了许多高级模型，包括Claude 3.5 Sonnet 和 GPT-4o。

对于那些需要快速处理大量数据的企业，Haiku 是一款理想的 AI 模型。能够应对比如电商平台上的个性化推荐，库存管理中的数据处理等场景。

升级版的 Claude 3.5 Sonnet 现已全面开放，所有用户均可使用。从今天起，开发者可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 访问和测试“模拟计算机访问”。而 Claude 3.5 Haiku 的发布定于本月晚些时候，敬请期待。