OpenAI新模型GPT-5或将无缘明年发布
AI的下一个飞跃似乎没法准时报道了。据外媒报道,OpenAI在推进其下一代核心模型GPT-5(代号Orion)的开发正面临重重困难,该项目已开发超过18个月,成本花费巨大却仍未取得预期成果。
本文引用地址:https://www.eepw.com.cn/article/202412/465753.htm内部消息透露OpenAI已经完成了至少两次大型训练运行,希望通过对大量数据的训练来改进模型。然而,训练进程较预期滞后,预示着更大规模的训练任务不仅耗时冗长,而且经济成本高昂。
估算显示,GPT-5一次为期6个月的训练仅计算成本就高达约5亿美元。OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)则表示,未来的AI模型成本预计将超过10亿美元。
模型的测试是一个持续的过程,大规模的训练运行可能需要几个月的时间,数万亿个token会被“投喂”给模型。想要让GPT-5变得更智能,就需要更多高质量、多样化的数据,为解决这一问题,OpenAI选择从头开始创建数据 —— 他们雇佣软件工程师和数学家等专业人士编写新代码或解决数学问题,以此作为训练数据。另外,OpenAI也开始开发“合成数据”,利用AI生成的数据来训练Orion,并认为可以通过使用其另一个AI模型o1生成的数据来避免故障。
值得注意的是,萨姆·阿尔特曼此前已公开承认,随着AI模型复杂度急剧上升,公司在多线程项目管理,尤其是计算资源的高效配置上,正面临前所未有的挑战。鉴于此,OpenAI已预计GPT-5将无缘下一年发布。
OpenAI首席产品官Kevin Weil进一步阐释了公司的当前战略重心,强调在推动视频模型Sora进入下一阶段重大升级之前,将致力于提升模型的安全性、模拟精准度以及计算规模的可扩展性,确保各项标准均达到行业顶尖水平。
OpenAI的下一个旗舰模型可能并不像其前辈那样代表着巨大的飞跃,尽管新模型的性能超过了OpenAI的现有模型,但与从GPT-3到GPT-4的跃升过程中所看到的相比,新模型的性能提升幅度较小。
评论