OpenAI发布新模型o1,更像理科生,不会多模态但推理才能超强

09-13 974阅读 0评论

9月13日音讯,上一年,OpenAI经过推出GPT-4,完成了人工智能范畴的一次严重打破。周四,该公司宣告了一个标志着其研讨方向改变的全新模型:OpenAI o1。

OpenAI o1具有共同的逻辑“推理”才能,能够处理许多现有模型(包含OpenAI现在最强壮的模型GPT-4o)无法处理的杂乱问题。与传统大言语模型一般一步给出答案不同,OpenAI o1像人类相同,经过逐渐推理,终究得出正确的定论。

OpenAI首席技能官米拉·穆拉蒂(Mira Murati)在承受采访时标明:“咱们将其视为人工智能模型开展的新范式,特别是在处理杂乱推理使命时,展现出了史无前例的优势。”

OpenAI o1的内部代号为“草莓”,并非旨在替代GPT-4,而是对其的弥补。

穆拉蒂还泄漏,OpenAI现在正在构建下一代主模型GPT-5,其规划将远超前代。虽然公司仍然以为扩展模型规划能带来新的打破,GPT-5估计将交融本次展现的推理技能。“咱们有两个开展方向,一个是规划扩展,另一个是推理才能提高,咱们期望终究将两者结合,”穆拉蒂说道。

大言语模型一般依靠巨大的神经网络和海量数据进行练习,展现出杰出的言语和逻辑才能,但在处理根本推理问题(如简略的数学题)时,体现欠安。

穆拉蒂指出,OpenAI o1采用了强化学习技能,经过对正确答案给出正反馈、过错答案给出负反馈,逐渐提高模型的推理战略。她弥补说:“这个模型不只提高了思想的敏锐度,还微调了它用于处理问题的战略。”强化学习现已协助计算机在游戏和杂乱使命(如芯片规划)中获得了超凡体现,一起也是开发高效、友爱的谈天机器人的要害技能。

OpenAI研讨副总裁陈信翰(Mark Chen)展现了OpenAI o1的才能,处理了GPT-4o无法处理的多个问题,包含杂乱的化学题和一个扎手的数学推理题。陈信翰标明:“新模型不再仅仅仿照人类思想办法,而是学会了独立思考。”

OpenAI称,新模型在多个范畴(如编程、数学、物理、生物和化学)的测验中体现出色。在美国数学邀请赛(AIME)中,GPT-4o均匀回答率为12%,而OpenAI o1的回答率则高达83%。

不过,OpenAI o1的速度不如GPT-4o,且其优势并非在一切情况下都显着,部分原因在于它无法查找网络,也不具有多模态功用,无法处理图画或音频数据。

近年来,提巨大言语模型的推理才能一直是研讨热门,竞争对手也在积极探索。谷歌本年7月宣告了AlphaProof项目,结合了言语模型和强化学习,专心于处理杂乱的数学问题。虽然AlphaProof能够经过正确答案学习数学推理,但面对的应战在于现实问题并非总有清晰答案。

OpenAI标明,其新推理体系具有更广泛的适用性。陈信翰以为:“咱们在这一范畴获得了打破,这也是咱们的优势地点。该体系在各个范畴的推理使命中体现出色。”

斯坦福大学教授诺亚·古德曼(Noah Goodman)曾宣布过关于提巨大言语模型推理才能的研讨,他以为,经过精心规划的提示性言语模型结合手艺优化数据,可能是完成推理才能提高的要害。古德曼还标明,假如能在速度和准确性之间获得平衡,将是“含义严重的前进”。

麻省理工学院助理教授Yoon Kim指出,大型言语模型的推理机制仍显得奥秘,虽然它们能够逐渐推理,但与人类思想或存在实质差异。这种差异在技能被广泛应用时可能会变得至关重要。他说:“这些体系可能会做出影响众多人的决议计划。更大的问题是,咱们能否信任它们的决议计划机制?”

OpenAI新技能或许还有助于保证AI模型的“良性行为”。穆拉蒂标明,新的推理模型能够经过对成果的推理,防止发生不良或有害的输出。她说:“就像教育孩子相同,一旦他们了解为什么要做某件事,他们就能更好地恪守标准、行为准则和价值观。”

华盛顿大学名誉教授、人工智能专家奥伦·埃齐奥尼(Oren Etzioni)指出:“让大言语模型具有多过程推理、运用东西和处理杂乱问题的才能至关重要,单靠规划扩展难以达到这一方针。”他弥补说,即便推理才能得到提高,错觉和现实验证问题仍然存在。

陈信翰泄漏,该公司开发的新推理办法标明,人工智能的开展并不一定需求巨大的算力支撑。“这一革新令人振奋。咱们信任它能以更低的本钱完成智能输出,而这正是咱们公司核愿望景的一部分。”(小小)

发表评论

快捷回复: 表情:
评论列表 (暂无评论,974人围观)

还没有评论,来说两句吧...

目录[+]