OpenAI 今天預告了**o3**模型——「推理」模型的進一步發展,也是**o1**的後繼者。 它在**ARC-AGI-1 基準測試上的改進給我留下了深刻的印象,ARC-AGI-1**基準測試被認為是當代LLMs無可比擬的基準測試。 o1 的最高分是 32%,而 o3 的得分則高達 88%。...