2025-06-01 10:43来源:本站
旧金山:OpenAI发布了一款新的人工智能系统OpenAI o3,旨在通过涉及数学、科学和计算机编程的问题进行“推理”。
该公司表示,该系统目前仅与安全和安全测试人员共享,在评估数学、科学、编码和逻辑技能的标准化基准测试中,其表现优于业界领先的人工智能技术。
新系统是今年公司推出的推理系统01的继任者。该公司表示,在一系列常见的编程任务中,OpenAI o3的准确率比o1高出20%以上,在一项竞争性编程测试中,它的表现甚至超过了首席科学家雅库布?帕乔基(Jakub Pachocki)。OpenAI表示,计划明年初向个人和企业推出这项技术。
OpenAI首席执行官萨姆·奥特曼(Sam Altman)在展示新系统的在线演示中表示:“这种模式在编程方面令人难以置信。”他补充说,至少有一个OpenAI程序员仍然可以在这次测试中击败该系统。
这项新技术是构建能够通过复杂任务进行推理的人工智能系统的更广泛努力的一部分。本周,谷歌发布了类似的技术,名为Gemini 2.0 Flash Thinking Experimental,并与一小部分测试者分享了这项技术。
这两家公司和其他公司的目标是构建能够通过一系列步骤仔细而合乎逻辑地解决问题的系统,每个步骤都建立在最后一个步骤的基础上。这些技术可能对使用人工智能系统编写代码的计算机程序员或在数学和科学等领域寻求自动导师帮助的学生很有用。
随着2022年底ChatGPT聊天机器人的首次亮相,OpenAI表明,机器可以更像人一样处理请求,回答问题,撰写学期论文和生成计算机代码。但这些回应有时是有缺陷的。
ChatGPT通过分析从互联网上挑选的大量文本,包括新闻文章、书籍、计算机程序和聊天记录,学习了它的技能。通过精确定位模式,它学会了自己生成文本。
因为互联网上充斥着不真实的信息,这项技术学会了重复同样的不真实。有时,它会编造一些东西,这种现象被科学家称为“幻觉”。
OpenAI利用所谓的“强化学习”构建了它的新系统。通过这个过程,系统可以通过大量的试验和错误来学习行为。例如,通过解决各种数学问题,它可以学习哪些技术可以得到正确的答案,哪些不能。如果它对大量的问题重复这个过程,它可以识别模式。
虽然像o3这样的系统被设计为推理,但它们基于与原始ChatGPT相同的核心技术。这意味着他们可能仍然会出错或产生幻觉。
该系统旨在“思考”问题。它试图将问题分解并寻找解决方法,这可能需要比普通聊天机器人更大的计算能力。这也可能是昂贵的。
本月,OpenAI开始向个人和企业销售OpenAI 01。其中一项服务面向专业人士,每月收费200美元(894令吉)。
(《纽约时报》去年12月起诉OpenAI和微软,指控它们侵犯了与人工智能系统相关的新闻内容的版权。这些公司否认了这些指控)-?2024纽约时报公司