OpenAI发布新模型o1，更像理科生，不会多模态但推理才能超强

09-13 974阅读 0评论

9月13日音讯，上一年，OpenAI经过推出GPT-4，完成了人工智能范畴的一次严重打破。周四，该公司宣告了一个标志着其研讨方向改变的全新模型：OpenAI o1。

OpenAI o1具有共同的逻辑“推理”才能，能够处理许多现有模型（包含OpenAI现在最强壮的模型GPT-4o）无法处理的杂乱问题。与传统大言语模型一般一步给出答案不同，OpenAI o1像人类相同，经过逐渐推理，终究得出正确的定论。

OpenAI首席技能官米拉·穆拉蒂（Mira Murati）在承受采访时标明：“咱们将其视为人工智能模型开展的新范式，特别是在处理杂乱推理使命时，展现出了史无前例的优势。”

OpenAI o1的内部代号为“草莓”，并非旨在替代GPT-4，而是对其的弥补。

穆拉蒂还泄漏，OpenAI现在正在构建下一代主模型GPT-5，其规划将远超前代。虽然公司仍然以为扩展模型规划能带来新的打破，GPT-5估计将交融本次展现的推理技能。“咱们有两个开展方向，一个是规划扩展，另一个是推理才能提高，咱们期望终究将两者结合，”穆拉蒂说道。

大言语模型一般依靠巨大的神经网络和海量数据进行练习，展现出杰出的言语和逻辑才能，但在处理根本推理问题（如简略的数学题）时，体现欠安。

穆拉蒂指出，OpenAI o1采用了强化学习技能，经过对正确答案给出正反馈、过错答案给出负反馈，逐渐提高模型的推理战略。她弥补说：“这个模型不只提高了思想的敏锐度，还微调了它用于处理问题的战略。”强化学习现已协助计算机在游戏和杂乱使命（如芯片规划）中获得了超凡体现，一起也是开发高效、友爱的谈天机器人的要害技能。

OpenAI研讨副总裁陈信翰（Mark Chen）展现了OpenAI o1的才能，处理了GPT-4o无法处理的多个问题，包含杂乱的化学题和一个扎手的数学推理题。陈信翰标明：“新模型不再仅仅仿照人类思想办法，而是学会了独立思考。”

OpenAI称，新模型在多个范畴（如编程、数学、物理、生物和化学）的测验中体现出色。在美国数学邀请赛（AIME）中，GPT-4o均匀回答率为12%，而OpenAI o1的回答率则高达83%。

不过，OpenAI o1的速度不如GPT-4o，且其优势并非在一切情况下都显着，部分原因在于它无法查找网络，也不具有多模态功用，无法处理图画或音频数据。

近年来，提巨大言语模型的推理才能一直是研讨热门，竞争对手也在积极探索。谷歌本年7月宣告了AlphaProof项目，结合了言语模型和强化学习，专心于处理杂乱的数学问题。虽然AlphaProof能够经过正确答案学习数学推理，但面对的应战在于现实问题并非总有清晰答案。

OpenAI标明，其新推理体系具有更广泛的适用性。陈信翰以为：“咱们在这一范畴获得了打破，这也是咱们的优势地点。该体系在各个范畴的推理使命中体现出色。”

斯坦福大学教授诺亚·古德曼（Noah Goodman）曾宣布过关于提巨大言语模型推理才能的研讨，他以为，经过精心规划的提示性言语模型结合手艺优化数据，可能是完成推理才能提高的要害。古德曼还标明，假如能在速度和准确性之间获得平衡，将是“含义严重的前进”。

麻省理工学院助理教授Yoon Kim指出，大型言语模型的推理机制仍显得奥秘，虽然它们能够逐渐推理，但与人类思想或存在实质差异。这种差异在技能被广泛应用时可能会变得至关重要。他说：“这些体系可能会做出影响众多人的决议计划。更大的问题是，咱们能否信任它们的决议计划机制？”

OpenAI新技能或许还有助于保证AI模型的“良性行为”。穆拉蒂标明，新的推理模型能够经过对成果的推理，防止发生不良或有害的输出。她说：“就像教育孩子相同，一旦他们了解为什么要做某件事，他们就能更好地恪守标准、行为准则和价值观。”

华盛顿大学名誉教授、人工智能专家奥伦·埃齐奥尼（Oren Etzioni）指出：“让大言语模型具有多过程推理、运用东西和处理杂乱问题的才能至关重要，单靠规划扩展难以达到这一方针。”他弥补说，即便推理才能得到提高，错觉和现实验证问题仍然存在。

陈信翰泄漏，该公司开发的新推理办法标明，人工智能的开展并不一定需求巨大的算力支撑。“这一革新令人振奋。咱们信任它能以更低的本钱完成智能输出，而这正是咱们公司核愿望景的一部分。”（小小）