OpenAI o3

新一代最强推理模型

顶级数学推理能力：o3在复杂数学问题上表现出色，例如在美国AIME数学竞赛中达到了96.7%的准确率。
卓越编程性能：在CodeForces编程竞赛平台上获得2727的ELO分数，超越顶尖程序员水平，并支持复杂任务的代码生成与执行。
科学问题解决能力：在GPQA科学基准测试中，o3达到87.7%的准确率，大幅超越人类专家平均水平。
透明推理路径：提供清晰的推理过程，能够展示每一步的逻辑思路和中间结论。
高效多任务处理：支持长上下文输入，能处理复杂的多步指令。
轻量版o3Mini：提供低成本、高效的计算能力，适合预算有限的应用场景。
强大的多模态支持：能处理文本与图像的混合输入，为多模态推理场景提供强大支持。

产品详情

OpenAI o3模型是继o1之后的新一代推理模型，包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能（AGI），在ARC-AGI基准测试中得分高达87.5%，远超人类平均水平。它在数学和编程任务中表现出色，在2024年美国数学邀请赛（AIME）中得分96.7%，在Codeforces评级中达到2727分。o3能够自我事实核查，通过“私人思维链”进行推理，提高答案的准确性。o3是首个使用“审议对齐”技术训练的模型，以符合安全原则。目前，o3模型尚未广泛可用，但安全研究人员可以注册预览o3-mini模型。o3 mini版将在1月底推出，之后不久推出o3完整版。

OpenAI o3

产品详情

相关项目

知了zKnown

MBox AI Meet

Klee

CrossPrism for MacOS