专栏中心

EEPW首页 > 专栏 > 元宇宙建设添利器 Meta强推视觉大模型多模态AI有望加速发展

元宇宙建设添利器 Meta强推视觉大模型多模态AI有望加速发展

发布人：科创板日报时间：2023-04-24 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

在AI大模型竞赛中，Meta选择重押视觉模型，继推出零样本分割一切的SAM后，扎克伯格亲自官宣了重量级开源项目DINOv2。

据介绍，DINOv2是计算机视觉领域的预训练大模型，模型参数量是10亿级，采用Transformer架构，能在语义分割、图像检索和深度估计等方面实现自监督训练，不需微调即可用于多种下游任务，可以被用于改善医学成像、粮食作物生长、地图绘制等。

DINOv2 用于语义分割，将图中每个像素划分类别

DINOv2 用于图像检索，查找与给定图像相关的图

DINOv2用于深度估计，给出图中物体到镜头的距离信息

DINOv2有何亮点？

主要体现在两方面——DINOv2可以为大语言模型提供丰富的图像特征，有助于完善多模态GPT应用；其蒸馏成小模型后效果依然优秀，便于在各种边缘场景及本地化落地。

对于前者，Meta已表示计划将DINOv2集成到更大、更复杂的AI系统中，作为视觉主干提供丰富的图像特征与大型语言模型进行交互。

国盛证券分析师刘高畅表示，DINOv2能比用图像文本对做训练的模型得到更丰富的图像特征，这将让整个系统能更好地理解图像，对多模态AI的发展起到加速作用。

值得注意的是，多模态技术还能助力游戏内容与元宇宙构造，随着AR/VR技术的发展，未来将能构建逼真的虚拟现实。扎克伯格就强调，DINOv2可以极大地加持元宇宙的建设，让用户在元宇宙中的沉浸体验更出色。

上述分析师大胆预测，1-5年内，随着多模态的发展带来AI泛化能力提升，通用视觉、通用机械臂、通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活。未来5-10年内，结合复杂多模态方案的大模型有望具备完备的与世界交互的能力，在通用机器人、虚拟现实等领域得到应用。

对于边缘场景落地，简单来说是指将大模型移植到移动端或是算力有限的场景。

运行大型的模型需要强大的硬件，这可能会限制模型在C端场景的应用，为大模型“瘦身”成了手机等移动终端运行大模型的前提，其技术路径多样，包括通过剪枝让模型稀疏化、知识蒸馏对模型进行压缩、通过权重共享来减少参数量等。

DINOv2即采用模型蒸馏的方式，将大型模型的知识压缩为较小的模型，从而降低推理时的硬件要求。据官方介绍，Meta开源了多个不同参数规模的预训练模型，在相同的规模下比较，DINOv2在多种测试基准的得分都能优于目前开源视觉模型中表现最好的OpenCLIP。

Meta之外，高通、华为等科技巨头也在致力于实现AI大模型在终端的轻量化部署，谷歌、腾讯、百度等已将模型压缩技术紧密结合移动端模型部署框架/工具。

专栏文章内容及配图由作者撰写发布，仅供工程师学习之用，如有侵权或者其他违规问题，请联系本站处理。联系我们

关键词： AI

更多焦点

更多视频

专栏中心

元宇宙建设添利器 Meta强推视觉大模型多模态AI有望加速发展

相关推荐

人工智能是如何帮助阻止造假者的？

尼吉康的事业介绍

AI/HPC新世代 COUPE光互连扮要角

万家乐JSYZ5-AI燃气热水器电路图

CSR8670CSR8675智能语音Alexa蓝牙方案开发

EEPW2018年6月刊(5G)

WTC-AI太阳能热水器电路图

基于Microchip MCU的AI/ML培训教程3

瑞萨电子AI单元解决方案成功提高GE医疗（日本）日野工厂的生产力

基于Ai-WB2-12F与Rd-04的雷达检测系统

研华科技与Axelera AI深化战略合作加速推动基于Europa平台的边缘AI创新

AI聊天机器人能像医生一样推理吗？

基于Microchip MCU的AI/ML培训教程1

前Qwen负责人林俊旸创业，目标融资规模为数亿美元

释说芯语16：硬科技：构建企业未来之路（附PPT）

基于VisitionX制造智能眼镜

被动元件新周期：AI时代高端化、服务器化重构MLCC产业格局

WTC-AI型太阳能热水器电路图

iCAN-4017 AI功能模块

联发科加速AI在地化应用布局

继上次海联达Ai-ap100拆机之电源改造

EEPW2018年3月刊(工业物联网)

海联达（Aigale）Ai-HD1 无线全高清套件拆解

存储器转型AI战略资源台厂受惠

思科凭借通用商用芯片与光模块赢得 AI 领域客户

PowiGaN for AI Data Centers: Unmatched Power Density and Reliability

重新构想AI电源：塑造AI加速的未来（第三部分）

电子元件培训教材

国家“算力网”：像用水用电一样用AI

基于Microchip MCU的AI/ML培训教程2

技术专区

专栏中心

元宇宙建设添利器 Meta强推视觉大模型 多模态AI有望加速发展

相关推荐

技术专区

元宇宙建设添利器 Meta强推视觉大模型多模态AI有望加速发展