有奖调查｜燧石红外感知，AI守护全场景安全免费领资料｜新一代车载充电机设计全解析你的工作台我们来宠！工程师必备工具征集！在线会｜ADI电源专家手把手教你做高可靠电源

我要投稿 | 手机版

首页　资讯　商机　下载　拆解　高校　招聘　杂志　会展　 EETV　百科　问答　电路图　工程师手册　 Datasheet　 100例　活动中心　 E周刊阅读　样片申请

EEPW首页 >> 主题列表 >> 多模态

多模态文章最新资讯

Meta推出Muse Spark多模态推理模型

Meta 平台公司今日推出了一款全新的推理模型Muse Spark，该模型在解答健康问题与分析多模态数据方面表现极为出色。未来几周内，Meta 将把该算法接入面向消费者的Meta AI人工智能服务中。此外，Meta 还将通过应用程序编程接口（API）向开发者开放 Muse Spark，目前该 API 处于非公开预览阶段。Meta 表示，Muse Spark 在多项基准测试中超越了 Claude 4.6 Opus、Gemini 3.1 Pro 与 GPT 5.4。其中一项测试为HealthBench Har
关键字： Meta Muse Spark 多模态推理模型

人工智能模型在一个简单的任务上表现惨败：计时

人工智能能力的快速发展让许多人感到担忧。但别太担心：如果你能正确读出模拟钟表，在这方面你仍然领先于人工智能。能够分析文本、图像和视频等不同类型媒体的人工智能模型——被称为多模态大型语言模型（MLLM），正在体育分析和自动驾驶等多个应用领域获得广泛关注。但有时，这些模型在看似最简单的任务上也会失败，比如准确读取模拟钟的时间。这就引发了一个问题：这些模型到底在哪些图像分析方面遇到了困难？例如，在阅读传统钟表时，模型是否难以区分短指针和长指针？或者难以准确定位手的角度和方向，相对于数字？这些看似琐碎的问题的答案
关键字：人工智能多模态

中国的一台机器人刚刚在三天内走了66英里——创造了新的世界纪录

在小说及同名电影《阿甘正传》中，主角阿甘连续跑了三年多，足迹遍布美国，总里程约达 15000 英里。对于大多数人而言，这样的成就遥不可及，但一款名为 AgiBot A2 的机器人近日也完成了一段意义非凡的长途行走挑战。这款机器人仅用三天时间就走完了 66 英里，创下了一项新纪录。若给予它和阿甘同等时长，其行走里程有望突破 24000 英里。何为 AgiBot A2？AgiBot（即智远机器人公司）于 2023 年在中国上海成立，初衷是为同名初代双足机器人的推出提供支持。此后几年间，该公司对其旗舰机型持续迭
关键字：机器人双足机器人多模态人工智能

新突思推出下一代Astra™多模态GenAI处理器，赋能智能物联网边缘的未来

新突思公司（Synaptics® Incorporated）近日宣布推出全新的Astra™ SL2600系列多模态边缘人工智能（Edge AI) 处理器，旨在提供卓越的性能和能效。Astra SL2600系列将赋能新一代经济高效的智能设备，让认知物联网（IoT）成为现实。SL2600系列将与SL2610产品线一起推出，包含五个针对不同Edge AI应用的处理器系列。这些处理器专为打造下一波智能家电、家居和工厂自动化设备、充电基础设施、医疗设备、零售销售点终端和扫描仪、自主机器人系统、无人机（UAV）、休闲
关键字：新突思 Synaptics 多模态 GenAI处理器

6TOPS算力驱动30亿参数LLM，米尔RK3576部署端侧多模态多轮对话

当 GPT-4o 用毫秒级响应处理图文混合指令、Gemini-1.5-Pro 以百万 token 上下文 “消化” 长文档时，行业的目光正从云端算力竞赛转向一个更实际的命题：如何让智能 “落地”？—— 摆脱网络依赖、保护本地隐私、控制硬件成本，让设备真正具备 “看见并对话” 的离线智能，成为边缘 AI 突破的核心卡点。2024 年，随着边缘 SoC 算力正式迈入 6 TOPS 门槛，瑞芯微 RK3576 给出了首个可量产的答案：一套完整的多模态交互对话解决方案。RK3576多模态纯文字：自我介绍如今，“端
关键字：瑞芯微 RK3576 NPU（神经网络处理器）端侧小语言模型（SLM）多模态 LLM 边缘AI部署开发板

Qwen2-VL-3B模型在米尔瑞芯微RK3576开发板NPU多模态部署指导与评测

随着大语言模型（LLM）技术的快速迭代，从云端集中式部署到端侧分布式运行的趋势日益明显。端侧小型语言模型（SLM）凭借低延迟、高隐私性和离线可用的独特优势，正在智能设备、边缘计算等场景中展现出巨大潜力。瑞芯微 RK3576 开发板作为一款聚焦边缘 AI 的硬件平台，其集成的 NPU（神经网络处理器）能否高效支撑多模态 LLM 的本地运行？性能表现如何？ RK3576 多模态纯文字：爱因斯坦有什么贡献RK3576 多模态纯文字：自我介绍本文将围绕这一核心问题展开 —— 从端侧 SLM 与云端 LL
关键字：瑞芯微 RK3576 NPU 端侧小语言模型 SLM 多模态 LLM

EDA开发流程中的多模态AI

RTL 编码是半导体开发的关键步骤，但许多人认为这并不是最困难的一步。随着您越来越接近实施，并且系统上下文变得比仅通过文本可以理解的要大，事情会变得更加复杂。在这两种情况下，布局、时间、功率和许多其他因素都会发挥作用，但没有一个是文本更容易表示的，而且它们不遵循相同的规则。正如流行的格言所说，“一张图片胜过千言万语”，这可能是非常保守的。框图、时序图、波形、状态图、流程图、平面图、布局、热图——用作输入和输出的图形形式列表非常广泛。人工智能需要能够理解并生成它们。这句格言也可以从另一个角度看待。图片以及所
关键字： EDA 多模态 AI

Gartner：到2030年，80%企业软件和应用将为多模态，2024年尚不足10%

Gartner预测，到2030年，多模态企业软件和应用将占比达80%，远高于2024年不到10%的水平。Gartner高级研究总监Roberta Cozza表示：“企业软件向多模态转变是一次企业运营和创新的根本转型。多模态生成式人工智能（GenAI）将带来此前无法实现的特性和功能，推动企业应用的升级演进，医疗、金融、制造等行业都将从中受益。该技术将通过增强特定领域语言模型，提高模型准确性，实现企业运营的自动化并驱动情境决策智能，使AI能够在各种任务中主动采取行动。”多模态GenAI模型等具有重大影响力的技
关键字： Gartner 多模态

Arm与阿里巴巴合作，KleidiAI与通义千问模型集成

Arm 控股有限公司（以下简称 “Arm”）今日发布与阿里巴巴淘天集团轻量级深度学习框架 MNN 的又一新合作。双方经由 Arm KleidiAI 的集成，成功让多模态人工智能 (AI) 工作负载通过阿里巴巴经指令调整的通义千问 Qwen2-VL-2B-Instruct 模型运行在搭载 Arm CPU 的移动设备上。该版本的通义千问模型专为端侧设备的图像理解、文本到图像的推理，以及跨多种
关键字： Arm 阿里巴巴 KleidiAI 通义千问多模态

多模态人工智能有哪些应用场景?

上一篇文章介绍了什么是生成式人工智能(Generative AI)(https://www.eepw.com.cn/article/202502/467350.htm)。本篇为您介绍与生成式人工智能有关系的多模态人工智能如何实现像人一样综合处理多个信息和数据，以及多模态人工智能有哪些常见应用场景。01 生成式AI与多模态AI人工智能技术正在迅速发展，不断改变我们的生活和业务等的存在方式。在这些人工智能技术中，目前特别受到关注的人工智能有“生成式人工智能”和“多模态人工智能”。生成式人工智能是一种拥有能够自
关键字：人工智能多模态

AI大模型迈向多模态，助力具身智能与机器人实现创新

你听过莫拉维克悖论 (Moravec's paradox) 吗？该悖论指出，对于人工智能 (AI) 系统而言，高级推理只需非常少的计算能力，而实现人类习以为常的感知运动技能却需要耗费巨大的计算资源。实质上，与人类本能可以完成的基本感官任务相比，复杂的逻辑任务对 AI 而言更加容易。这一悖论凸显了现阶段的 AI 与人类认知能力之间的差异。人本来就是多模态的。我们每个人就像一个智能终端，通常需要去学校上课接受学识熏陶（训练
关键字： 202411 AI大模型多模态具身智能机器人

利用信号调节器的抗混淆滤波器实现混合信号、多模态传感器调节

引言一些传感器信号调节器用于处理多个传感元件的输出。这种处理过程通常由多模态、混合信号调节器完成，它...
关键字：多模态混合信号传感器信号调节器

多模态介绍

您好，目前还没有人创建词条多模态!
欢迎您创建该词条，阐述对多模态的理解，并与今后在此搜索多模态的朋友们分享。创建词条

热门主题

树莓派 linux

关于我们 - 广告服务 - 企业会员服务 - 网站地图 - 联系我们 - 征稿 - 友情链接 - 手机EEPW
Copyright ©2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《电子产品世界》杂志社版权所有北京东晓国际技术信息咨询有限公司

京ICP备12027778号-2 北京市公安局备案：1101082052 京公网安备11010802012473