前言
就在12月4日,OpenAI宣布将在未来的 12 天进行 12 场直播,每天发布最新AI技术。
而在12天12场直播活动的首秀中,OpenAI宣布了o1 完全体(Full Version)以及GPT4.5(目前已被设置为不可见,估计得过段时间),以及一项面向高级用户的新订阅服务——ChatGPT Pro,每月费用高达200美元。
这次发布引起了AI社区的广泛关注。让我们来重新梳理一下这些更新背后有哪些重要变化。
完整版o1模型:更快、智能、强大
早在今年9月,OpenAI就推出了o1模型的预览版o1-preview,也曾对o1的技术思路进行了介绍:o1是使用大规模强化学习训练并使用思维链进行推理的系列模型。
此次正式发布的o1完整版则在性能、速度和准确性上较预览版有了显著提升,同时新增了多模态输入功能,允许用户上传图片以便获得更精确的回答。
相比预览版,o1完整版的”思维”速度提高了50%,在回答困难现实问题时出现重大错误的概率减少了34%。例如,在列出2世纪罗马皇帝信息的任务中,o1仅用14秒便完成了回答,而预览版则需要34秒。
o1的另一大亮点是支持图片输入,用户可以上传手绘示意图,并得到相应的分析和解答。
直播中,OpenAI演示了o1基于一张手绘太空太阳能驱动数据中心的示意图进行推理的能力,它不仅成功估算了散热器的表面积,还就太阳与深空环境的处理方式提供了解释,推理时间仅为10秒。
200刀订阅Pro服务究竟值不值?
此次发布会的另一项重要内容是推出了ChatGPT Pro,价格高达每月200美元,比现有的ChatGPT Plus订阅(每月20美元)贵了整整十倍,现已正式上线!
ChatGPT Pro plan 专业版计划
这项服务面向对模型能力要求更高的用户,提供了无限量访问包括o1完整版、o1 mini和高级语音模式在内的所有模型,还包含一个特别的o1 pro模式。
o1 pro模式通过更多的计算资源来进行深入推理,特别适用于最复杂的数学、科学和编程问题,目标是为这些挑战性任务提供最佳答案。
外部专家的测试评估表明,相较于普通版本的o1和预览版,o1 pro在数学、科学和编程方面的表现更为出色,特别是在编码竞赛题中的错误率降低了75%。
值得一提的是,o1 pro模式采用更严格的可靠性评估标准——必须在四次尝试中全部答对(4/4可靠性)才被视为问题已解决,这种精确度使它在数据科学、判例法分析等复杂领域表现尤为突出。
直播中,OpenAI 也进行了演示。
首先,OpenAI 通过一个基于人工鸟巢图像生成安装手册的示例演示了 o1 基于视觉数据进行推理的能力:
推理速度方面,在解答「列出二世纪的罗马皇帝的在位时间和成就」的任务中,o1 完全体的推理时间大概为 14 秒,而 o1-preview 大概需要 33 秒。并且 Altman 表示实际部署之后的速度还会更快。
那么,o1 处理更复杂问题的表现如何呢,比如能否基于多条描述推断出所描述的蛋白质种类?(注意这个问题之前的 o1-preview 无法正确解答。)
最终,在 pro mode 下,o1 完全体在思考了 53 秒之后得到了正确答案,并且还可以在 canvas 中了解更多细节。
ChatGPT Pro与Plus用户的区别
ChatGPT Plus用户依然可以通过模型选择器访问o1模型,但其功能和体验与Pro用户相比存在显著差异。
Pro订阅用户可以无限制地访问更多的模型和功能,包括更强的o1 pro模式,这意味着对于高复杂度的推理和高要求的任务,Pro用户可以得到更准确和全面的回答。
同时,Pro用户还能体验高级语音模式,这种功能不仅提高了交互体验,还可能成为未来人机对话的关键技术。
而对于价格较为敏感的用户来说,ChatGPT Pro的200美元月费无疑是一个不小的门槛。相较之下,Plus订阅费用仅为20美元,但受限于每日使用时间。
而Pro服务之所以价格如此高昂,部分原因在于OpenAI试图缩小亏损,增加收入来源,尤其是考虑到高昂的AI训练和维护成本。