大模型将成为AI开发新范式

作者：时间：2022-06-30 来源：电子产品世界

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

人工智能的落地已经发展到一定阶段，向前一步的瓶颈在于某一厂商往往不具备足够的可用于模型训练的数据资源，且缺乏充足的算力，很难将偏通用的AI模型落地到企业场景中。行业参与者面对这些挑战推出多项举措，包括自动化机器学习、联邦学习、提供云端算力等，其中大模型是现阶段解决这些挑战的重要途径之一。

本文引用地址：https://www.eepw.com.cn/article/202206/435760.htm

什么是大模型？

在大模型的早期阶段，厂商宣传中常提到千亿级、万亿级参数为特大模型、超大模型。而在产业实际落地阶段，不再追求模型参数的数量。IDC认为，大模型是对原有算法模型的技术升级，基于海量数据开发预训练模型，到最终用户环境中使用少量数据即可获得比之前的算法模型更好的结果，其要点在于：

1 预训练型学习了多少数据

2 迁移学习的效果如何

3 部署的整体成本如何

主流的大模型厂商

大模型浪潮最早起源于预训练模型，Google发布的Bert模型即是自然语言处理领域最为典型的预训练模型。OpenAI则提出的GPT模型，尤其是2020年发布的GPT-3模型参数量即达到1750亿，在全球掀起大模型的浪潮。可以说，在AI模型开发领域，经历了预训练模型-大规模预训练模型-超大规模预训练模型的演进。

在国内，IDC观察到目前大力投入大模型的研发和落地的厂商以大型云服务商为主。例如，百度智能云“文心大模型”，包括了NLP大模型、CV大模型以及跨模态大模型，其特色在于注重跨模态技术研发，融入海量知识进行知识增强，应用场景广泛且落地实践丰富。阿里达摩院则推出“通义大模型”系列，以M6大模型为底座，发布Alice一系列模型合集，该大模型系列既在阿里内部核心业务场景落地，也在外部医疗、能源、金融行业积累了多个实践案例。华为则从框架层、算力层以及软件层面全面发力大模型，既有内部自主研发的盘古大模型，也开放华为昇思MindSpore框架支持业界进行大模型的训练，华为在大模型领域强调强泛化能力、模型精度的提升以及研发成本的降低。此外，京东云、浪潮以及主流的人工智能研究院也在积极投入大模型的研发，典型的大模型有智源研究院悟道2.0模型、浪潮“源1.0”大模型等。

现阶段如何看待和采用大模型？

随着市场对于大模型的认知逐渐理性和落地，使用大模型的价值也开始凸显，包括：不要求企业具备海量的数据基础、应用大模型的效果更优、降低AI开发门槛等。行业用户可以优先从相对落地的场景开始，例如智能客服、文档内容抽取、知识图谱、OCR等。在选择大模型的时候，可以考虑：大模型学习过的数据量/知识量、经过迁移学习后在本企业应用场景中落地的效果、对于本地算力的需求。

IDC中国助理研究总监卢言霞表示：“大模型的泛化能力强、模型效果更优等特征助力其成为AI开发新范式，也是现阶段AI市场发展的必然趋势。行业用户中AI先行者可以考虑优先在成熟度较高的场景中引入大模型，来适配本行业的细分场景。”

新闻中心

大模型将成为AI开发新范式

评论

相关推荐

技术专区