10月22日,Anthropic 再次引爆了我们的期待,Claude 3.5 Sonnet 和 Claude 3.5 Haiku 的发布,让人们看到 AI 编程的未来正以超乎预期的速度到来。
这两款模型不仅在编程能力上大幅提升,还通过一个令人激动的新功能——“模拟计算机访问”,让我们真正看到了 AI 模型模拟人类操作电脑的无限可能。
1. “模拟计算机访问”
如果说 Claude 3.5 系列有什么真正让人耳目一新的功能,那一定是“模拟计算机访问”。通过这个功能,Claude 不再只是一个静态的工具,而是能够像人类一样操作电脑。是的,你没有听错!Claude 可以打开文件、点击按钮、输入文本,甚至执行复杂的多步骤任务。
开发人员可以通过 API控制 Claude指示 Claude 自动填写表格、浏览网页,甚至完成软件测试等繁琐的任务。
虽然这项技术还在不断完善中,但其潜力已经让人无比期待。在 OSWorld 测试中,Claude 在依靠截图操作的任务中得分达到 14.9%,领先于其他 AI 系统。
目前已在Claude 3.5 Sonnet公测版中提供该功能。
2. Claude 3.5 Sonnet
Claude 3.5 Sonnet 是 Anthropic 目前最为强大的编程 AI,Sonnet 在编码任务中的表现十分亮眼,尤其是在 SWE-bench 测试中,它的得分从 33.4% 一跃提升至 49.0%,超越了所有同类 AI 模型。
对于那些日常需要频繁处理复杂编码任务的开发者来说,Sonnet 如同一双“加速的翅膀”。从 DevOps 的自动化操作到开发环境中的安全监控,Sonnet 都展现出了卓越的处理能力。
3. Claude 3.5 Haiku
如果你正在寻找性价比高,同时又不牺牲速度的 AI 模型,那么 Claude 3.5 Haiku 绝对是你的不二选择。Haiku 保持了上一代的低延迟和高效能,但在性能上实现了质的飞跃。
在 SWE-bench 测试中,Haiku 的得分达到了 40.6%,超过了许多高级模型,包括Claude 3.5 Sonnet 和 GPT-4o。
对于那些需要快速处理大量数据的企业,Haiku 是一款理想的 AI 模型。能够应对比如电商平台上的个性化推荐,库存管理中的数据处理等场景。
升级版的 Claude 3.5 Sonnet 现已全面开放,所有用户均可使用。从今天起,开发者可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 访问和测试“模拟计算机访问”。而 Claude 3.5 Haiku 的发布定于本月晚些时候,敬请期待。