分析发现,“推理”人工智能模型的改进可能会很快放缓
非营利性人工智能研究机构Epoch AI的一项分析表明,人工智能行业可能无法通过推理人工智能模型获得巨大的性能提升。根据报告的调查结果,在一年内,推理模型的进展可能会放缓。
本文引用地址:https://www.eepw.com.cn/article/202505/470376.htm近几个月来,OpenAI的o3等推理模型在人工智能基准上取得了重大收益,特别是衡量数学和编程技能的基准。这些模型可以将更多的计算应用于问题,这可以提高其性能,但缺点是它们比传统模型需要更长的时间来完成任务。
推理模型是通过首先在大量数据上训练常规模型,然后应用一种称为强化学习的技术来开发的,这有效地为模型提供了对其难题解决方案的“反馈”。
据Epoch称,到目前为止,像OpenAI这样的前沿人工智能实验室还没有将大量的计算能力应用于推理模型培训的强化学习阶段。
那正在改变。OpenAI表示,它应用的计算比其前身o1多10倍左右来训练o3,Epoch推测,这些计算大部分都用于强化学习。OpenAI研究员Dan Roberts最近透露,该公司的未来计划要求优先使用强化学习,以使用更多的计算能力,甚至比初始模型培训还要多。
但每个纪元,有多少计算可以应用于强化学习仍然有一个上限。
Epoch的分析师、分析的作者Josh You解释说,标准人工智能模型培训的绩效收益目前每年翻两番,而强化学习的绩效收益每3-5个月增长十倍。他继续说,推理训练的进展“到2026年可能与整体前沿相融合”。
Epoch的分析提出了一些假设,并部分借鉴了人工智能公司高管的公开评论。但它也证明,由于计算以外的原因,包括高昂的研究间接费用,扩展推理模型可能被证明具有挑战性。
“如果研究需要持续的间接费用,推理模型可能不会像预期的那样扩展,”你写道。“快速计算缩放可能是推理模型进展中非常重要的因素,因此值得密切跟踪这一点。”
任何表明推理模型在不久的将来可能会达到某种限制,这可能会让人工智能行业担心,因为人工智能行业投入了大量资源来开发这些类型的模型。研究表明,推理模型的运行成本可能非常昂贵,但存在严重的缺陷,例如比某些传统模型更倾向于产生幻觉。
评论