“O3模型解析:昂贵AI,非富即贵?”
科技资讯报道——近日,业界知名科技媒体TechCrunch发表文章指出,尽管OpenAI的o3模型在ARC-AGI等基准测试中表现出色,但其高昂的计算成本使得其在短期内难以普及于实际应用场景。
o3模型的性能优势显著。该模型具备调整推理时间的功能,分为低、中、高三个计算级别。在高端计算设置下,o3模型在ARC-AGI基准测试中取得了高达87.5%的分数,而低计算设置下的得分为75.7%,性能是前代模型o1的三倍。在EpochAI的Frontier Math基准测试中,o3模型解决了25.2%的问题,远超其他模型(均不超过2%),创造了新的纪录。
然而,o3模型的高成本也成为其普及的障碍。据ARC-AGI测试性能图表显示,o3模型在高端计算设置下,每项任务都使用了价值超过1000美元(约合人民币7303元)的计算资源。相比之下,o1模型每项任务仅需约5美元的计算资源,而o1-mini模型则仅需几美分。这意味着,虽然o3模型在测试中获得了高达88%的高分,但其所消耗的计算资源是o1模型的170多倍。在高计算设置下,整个测试过程的计算资源调用成本甚至超过1万美元(约合人民币73033元),这仅限于财力雄厚的机构和个人承担。
对此,ARC-AGI基准测试的创建者François Chollet表示,尽管o3模型是AI领域的一个重要突破,但其高昂的成本确实限制了其应用范围。他认为,未来降低o3模型使用成本的关键在于开发更高效的AI推理芯片和更具成本效益的AI芯片。目前,o3模型更适合处理复杂问题,如长期战略决策,而非日常小问题。随着技术的不断发展,我们有理由相信,成本效益更高的AI模型将逐渐走进我们的日常生活。