OpenAI 推出 o1 系列模型丨首款具有“推理”能力的模型

标记狮私有云部署
一键部署标记狮至私有服务器,构建快速,安全,高效,私密的UI设计团队云协作

OpenAI 推出 o1 系列模型丨首款具有“推理”能力的模型_2.jpg

OpenAI 今天发布了 o1 模型系列,传闻中的"Strawberry"模型已经到来。o1 系列包括 o1-preview 和 o1-mini 两个版本,它们通过大规模强化学习训练,学会了使用"思维链"进行复杂推理。

o1 系列:思考型 AI 的崛起

OpenAI 推出 o1 系列模型丨首款具有“推理”能力的模型_4.webp

o1 系列的核心特点是其强大的推理能力。与传统的语言模型不同,o1 在回答问题前会先进行深入思考。它能够生成长串的思维链,将复杂问题分解为简单任务的序列,并在需要时尝试不同的策略。并且具备了识别和纠正错误的能力,在处理复杂任务时表现出色。

想象o1模型就像一个聪明的学生。这个学生不再死记硬背所有知识,而是学会了如何思考和找答案。当遇到不懂的问题时,它不会胡乱猜测,而是会说"等等,我查一下"。它知道如何上网搜索信息,或者用工具检查自己的想法是否正确。这样,o1就像有了一个永不过时的"活字典",随时都能获取最新、最准确的信息。

o1-preview 是该系列的早期版本,而 o1-mini 则是一个经过优化的小型模型,特别适合编程和 STEM 领域的应用。两者都在各种复杂推理测试中表现优异,尤其是在准确生成和调试复杂代码方面。

安全性与透明度的提升

o1 系列不仅在性能上有所突破,在安全性和透明度方面也取得了重大进展。通过使用思维链,o1 模型能够更好地理解和执行安全规则,提高了模型的可控性。同时,为了平衡透明度和用户体验,o1 在 ChatGPT 中只展示思维链的摘要,而非完整的推理过程。

OpenAI 推出 o1 系列模型丨首款具有“推理”能力的模型_3.png

应用场景与访问限制

o1 系列的应用范围广泛,特别适合科学研究、编程和数学等需要复杂推理的领域。目前 o1-preview 的访问仍有限制。

ChatGPT Plus 和 Team 用户每周可使用 30 次,而 Enterprise 和 Edu 用户将在下周获得访问权限。o1-mini 的访问限制相对宽松,ChatGPT Plus 和 Team 用户每周可使用 50 次,且计划向所有 ChatGPT Free 用户开放。

访问o1非常昂贵,在API中,o1-preview的输入tokens(即模型解析的文本块)费用为每100万个15美元,输出tokens为每100万个60美元。相比之下,GPT-4o的费用是每100万个输入tokens5美元,每100万个输出tokens15美元。

o1 vs GPT-4o:各有千秋

o1 系列并非在所有领域都优于 GPT-4o。在需要高度推理的任务中,o1 的表现确实更胜一筹。但在以语言为中心的任务中,GPT-4o 仍然占据优势。这种互补性暗示了 AI 发展的新方向:不同模型可能会针对特定任务进行优化,而非追求全能。

例如,在复杂的 UI/UX 设计问题上,o1 可能提供更深入的分析和建议。在编写复杂的 CSS 或 JavaScript 代码时,o1-mini 的高效推理能力可能会成为得力助手。

OpenAI 的 o1 系列代表了 AI 技术的一个重要里程碑。它展示了 AI 不仅能快速反应,还能进行深度思考。这种能力的提升将为各行各业带来新的可能性,尤其是在需要复杂推理的领域。

https://openai.com/index/learning-to-reason-with-llms/

标记狮私有云部署
一键部署标记狮至私有服务器,构建快速、安全、高效、私密的UI设计团队云协作
立即部署>>
标记狮私有云部署-一键部署标记狮至私有服务器,构建快速,安全,高效,私密的UI设计团队云协作