新闻中心

EEPW首页 > 智能计算 > 业界动态 > 李飞飞团队低成本AI模型实为基于阿里云Qwen模型监督微调而成

李飞飞团队低成本AI模型实为基于阿里云Qwen模型监督微调而成

作者: 时间:2025-02-07 来源:SEMI 收藏

2月7日消息,日前有报道称等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

本文引用地址:https://www.eepw.com.cn/article/202502/466683.htm

然而,经《科创板日报》记者调查后发现,s1模型的训练并非从零开始,其基座模型为阿里通义千问(Qwen)模型。s1用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对千问模型进行微调而成。



关键词: 李飞飞 openAI

评论


技术专区

关闭