专栏中心

EEPW首页 > 专栏 > 聆思CSK6大模型多模态语音交互开源SDK介绍

聆思CSK6大模型多模态语音交互开源SDK介绍

发布人：ListenAI 时间：2024-06-13 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

聆思CSK6大模型多模态SDK除了支持语音交互之外，还支持图像方面的交互，包括对图像的识别以及图片生成。用户可以通过语音交互、摄像头拍照作为交互入口，实现与大模型的多模态交互。

SDK主要包含以下功能：

●语音交互：支持按键录音或唤醒后通过语音与大模型进行对话

●拍照识图：支持通过摄像头拍摄图像并上传给大模型进行识别，支持依据识图内容进行提问

●图片生成：支持通过语音交互描述画面内容，令大模型生成图片并显示至套件屏幕上

语音交互模式支持的语音交互模式

多模态SDK支持三种交互方式，其特点如下：

模式	唤醒方式	交互方式
按键交互	按下屏幕麦克风图标或开发板K3按键	按住按键说话，松开提交
语音唤醒(单轮)	唤醒词 “小美小美”	听到提示音 “在呢” 后进行提问，每次提问均需要唤醒
语音唤醒(多轮)	唤醒词 “小美小美”	听到提示音 “在呢” 后进行提问，可持续对话，当超过20秒无语音输入时自动结束本次交互

语音交互模式的切换

在待机页面，下滑可调出下滑菜单，点击下滑菜单中的设置图标，可进行配置页面：

选中对应的模式后，点击左上角即可回到待机页面并生效。

按键交互模式

设置成按键交互(按键唤醒)模式下，按住屏幕上的麦克风按钮或开发板上的K3按键，即进入录音状态，松开按键则结束录音并提交。

语音唤醒模式

当设置为语音唤醒(单轮)或语音唤醒(多轮)，可通过唤醒词 —— “小美小美” 对设备进行唤醒，当听到 “在呢” 的提示音后，即可正常进行语音输入。

退出对话

在使用过程中，点击左上角结束本轮对话回到待机页面，此操作会同步清除本次对话的上下文信息。

拍照识图

在待机页，点击拍照按钮即可进入取景页面，对准要拍照的物体，点击右侧中间的拍照键完成抓拍，确认画面抓拍正常后（无晃动模糊的情况），点击右侧的 √ 进行提交识别：

文生图

在设备进入语音交互状态后，可以通过带有绘画意图的提示词让大模型进行作画，比如：

●“画一只熊猫”

●“画一个人正在使用电脑”

SDK资源下载

语音视觉大模型开发板 SDK：https://cloud.listenai.com/CSKG962172/duomotai_ap/-/tree/master/

DEMO固件下载：https://docs2.listenai.com/x/UzjbjIAxw

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。

关键词： 聆思csk6 大模型开发板 Zephyr RTOS CSK6011A

相关推荐

新版本GUI Guider驾到！多项重磅更新，让你的HMI开发更智能、更高效！

新年伊始，GUI Guider也迎来了全新版本！这一次，我们带来了多项重磅更新，旨在为你提供更强大、更便捷的开发体验。无论你是工业控制、智能家居，还是消费电子领域的开发者，这些更新都将为你的项目注入新的活力！新版本八大新...

嵌入式系统 GUI HMI Zephyr 2025-02-08

RTOS课程建设

RTOS课程建设...

资源下载 RAM 嵌入式系统 RTOS 实时操作系统 2007-02-09

从系统设计到源代码：Tobias Kästner 谈 Zephyr

在 11 月 5 日举行的 Elektor 在线会议“Zephyr – 面向未来设备的开放式 RTOS”之前，我们采访了演讲者 Tobias Kästner，讨论了功能架构在现代嵌入式项目中的重要性。咨询公司 inove...

嵌入式系统系统设计源代码 Zephyr 2025-10-30

风河进一步扩展VxWorks RTOS实时容器领导地位

全球领先的关键任务智能系统软件提供商风河公司近日宣布支持Sigstore公司的Cosign并提供实时操作系统（RTOS）容器引擎。随着此项合作的达成，基于VxWorks的设备在使用容器技术来部署和管理软件时将会获得更高的...

嵌入式系统风河 VxWorks RTOS 实时容器 2023-12-22

2025年需要考虑的6大实时嵌入式技术

在高级计算能力、人工智能和互联系统日益增长的需求的融合的推动下，嵌入式系统领域正在经历前所未有的变革。随着我们迈向 2025 年，传统嵌入式系统和复杂计算平台之间的区别继续模糊，为开发人员和系统架构师创造了新的机遇和挑战...

嵌入式系统实时嵌入式技术 RISC-V RTOS 时间敏感网络 TSN 2025-03-02

实时系统的实现(PDF)

实时系统的实现(PDF)...

资源下载 Inter 8051 RTOS VXworks ROBOT 2007-02-09

AVR单片机的RTOS-AVRX应用

flycat2008 2008-08-01

IAR加入Zephyr项目成为银牌会员，强化对开源协作的承诺

全球领先的嵌入式系统开发软件解决方案供应商IAR宣布，正式加入Zephyr项目，成为银牌会员。Zephyr是由Linux基金会托管并广泛应用于嵌入式行业的开源实时操作系统（RTOS），已得到众多嵌入式领域的重要企业支持。...

嵌入式系统 IAR Zephyr 开源协作 2025-02-12

[转帖]RTOS-μITRON

amine 2003-01-16

动态心电图仪holter的设计

zt1234 2013-05-07

DSP开发全过程经典

DSP开发全过程经典...

资源下载 TI DSP embedded system RTOS 2007-12-29

从RTOS到Linux的应用移植

设计方案应用移植 RTOS Linux 2015-06-25

RX系列软件的进化史和对未来的展望 #1

我自从2003年加入瑞萨以来，一直希望能开发出一种具备互联网连接功能的微型无线设备（无电池），经过20年的努力，这一梦想即将实现。今后，我还将继续致力于开发体积更小、功耗更低、更易于使用的单片机和兼容软件的开发。近年来，...

网络与存储 MPU RX系列 RTOS 2023-11-17

RTOS和CPU指令设计—uc/os—||| 的启示

《RTOS和CPU指令设计—uc/os—||| 的启示》，清华大学教授、博导邵贝贝...

视频中国芯 RTOS CPU 2011-01-07

QNX 的 RTOS 平台

QNX 的 RTOS 平台...

资源下载 IAR QNX RTOS 嵌入式实时系统 2007-02-09

咨询-DM642+RTOS(非DSP/BIOS),有否大侠做.

igxnu 2006-11-23

嵌入式MCU程序框架设计：三种经典模式，你该选哪种？

在嵌入式开发中，程序框架设计是决定系统性能、可维护性和开发效率的关键。今天，我们将介绍三种经典的嵌入式MCU程序框架设计模式：顺序执行的前后台系统、时间片轮询系统和多任务操作系统（RTOS）。每种模式都有其独特的优势和适...

嵌入式系统嵌入式MCU程序框架设计 RTOS 2025-02-26

RTOS 姐妹花 - (陈明计专题)

RTOS 姐妹花 - (陈明计专题)...

资源下载 IAR 嵌入式实时系统 RTOS 2007-02-09

RTOS电子书

machinnneee 2015-09-22

学RTOS从配置文件开始！

最近有小伙伴问：学RTOS从哪里开始？这个问题说简单也简单，说难也难，因为每个人掌握的基础不同，自然，从哪里开始学起也各有不同。首先你要去了解RTOS相关的一些基础知识，然后再下载源码实践运行，跑起来！接下来真正入门的第...

RTOS 配置文件 2024-12-24

嵌入式系统的创新：RTOS与MCU的协同运作

本文深入探讨Green Hills可靠的RTOS与意法半导体尖端MCU之间运用资源和协同运作，为何是开发者的最佳选择。Green Hills Software为意法半导体的授权合作伙伴，开发出一套整合硬件与软件的解决方案...

嵌入式系统嵌入式系统 RTOS MCU Green Hills 意法半导体 2024-07-10

Stella：Self-Balancing Robot Powered by Nucleus RTOS on TI Stellaris

Meet Stella a remote controlled, self-balancing robot powered by Mentor Graphics Nucleus RTOS and developed wi...

视频 TI RTOS 2012-03-30

了解如何使用shell实用程序“direnv”在West工作区中工作时自动激活Zephyr构建环境

设计方案工具链 Zephyr SDK代码 2025-08-19

IAR平台现已提供对Zephyr RTOS的量产级支持

全球领先的嵌入式系统开发软件解决方案供应商IAR宣布，其嵌入式开发平台正式推出对Zephyr RTOS的量产级支持。该支持自IAR的Arm开发工具链v9.70起全面提供。这一进展为希望在商业化和安全关键型嵌入式应用中采用...

嵌入式系统 IAR Zephyr RTOS 2025-07-09

更多 培训课堂

更多焦点

更多视频

技术专区