OpenAI 推出 o1 系列模型丨首款具有“推理”能力的模型

发表于 2024-09-13

标记狮私有云部署

一键部署标记狮至私有服务器，构建快速，安全，高效，私密的UI设计团队云协作

OpenAI 推出 o1 系列模型丨首款具有“推理”能力的模型_2.jpg

OpenAI 今天发布了 o1 模型系列，传闻中的"Strawberry"模型已经到来。o1 系列包括 o1-preview 和 o1-mini 两个版本，它们通过大规模强化学习训练，学会了使用"思维链"进行复杂推理。

o1 系列：思考型 AI 的崛起

OpenAI 推出 o1 系列模型丨首款具有“推理”能力的模型_4.webp

o1 系列的核心特点是其强大的推理能力。与传统的语言模型不同，o1 在回答问题前会先进行深入思考。它能够生成长串的思维链，将复杂问题分解为简单任务的序列，并在需要时尝试不同的策略。并且具备了识别和纠正错误的能力，在处理复杂任务时表现出色。

想象o1模型就像一个聪明的学生。这个学生不再死记硬背所有知识，而是学会了如何思考和找答案。当遇到不懂的问题时，它不会胡乱猜测，而是会说"等等，我查一下"。它知道如何上网搜索信息，或者用工具检查自己的想法是否正确。这样，o1就像有了一个永不过时的"活字典"，随时都能获取最新、最准确的信息。

o1-preview 是该系列的早期版本，而 o1-mini 则是一个经过优化的小型模型，特别适合编程和 STEM 领域的应用。两者都在各种复杂推理测试中表现优异，尤其是在准确生成和调试复杂代码方面。

安全性与透明度的提升

o1 系列不仅在性能上有所突破，在安全性和透明度方面也取得了重大进展。通过使用思维链，o1 模型能够更好地理解和执行安全规则，提高了模型的可控性。同时，为了平衡透明度和用户体验，o1 在 ChatGPT 中只展示思维链的摘要，而非完整的推理过程。

OpenAI 推出 o1 系列模型丨首款具有“推理”能力的模型_3.png

应用场景与访问限制

o1 系列的应用范围广泛，特别适合科学研究、编程和数学等需要复杂推理的领域。目前 o1-preview 的访问仍有限制。

ChatGPT Plus 和 Team 用户每周可使用 30 次，而 Enterprise 和 Edu 用户将在下周获得访问权限。o1-mini 的访问限制相对宽松，ChatGPT Plus 和 Team 用户每周可使用 50 次，且计划向所有 ChatGPT Free 用户开放。

访问o1非常昂贵，在API中，o1-preview的输入tokens（即模型解析的文本块）费用为每100万个15美元，输出tokens为每100万个60美元。相比之下，GPT-4o的费用是每100万个输入tokens5美元，每100万个输出tokens15美元。

o1 vs GPT-4o：各有千秋

o1 系列并非在所有领域都优于 GPT-4o。在需要高度推理的任务中，o1 的表现确实更胜一筹。但在以语言为中心的任务中，GPT-4o 仍然占据优势。这种互补性暗示了 AI 发展的新方向：不同模型可能会针对特定任务进行优化，而非追求全能。

例如，在复杂的 UI/UX 设计问题上，o1 可能提供更深入的分析和建议。在编写复杂的 CSS 或 JavaScript 代码时，o1-mini 的高效推理能力可能会成为得力助手。

OpenAI 的 o1 系列代表了 AI 技术的一个重要里程碑。它展示了 AI 不仅能快速反应，还能进行深度思考。这种能力的提升将为各行各业带来新的可能性，尤其是在需要复杂推理的领域。

https://openai.com/index/learning-to-reason-with-llms/