新闻中心

EEPW首页 > 物联网与传感器 > 设计应用 > 基于 RTL8723DS +A113 开发的智能音箱模块设计方案

基于 RTL8723DS +A113 开发的智能音箱模块设计方案

作者:时间:2022-08-01来源:大联大收藏

一、前言

本文引用地址:http://www.eepw.com.cn/article/202208/436895.htm

AI智能音箱是人工智能与传统音箱结合的产物。其基本原理是用户使用自然语言与机器(即音箱)交流,音箱通过识别用户的语音指令完成相应任务,如点播音乐、收听新闻、设置日程、查询信息等。当今AI智能音箱,已被认为是物联网时代的入口,在去年成为了各大厂商争相投入的风口。因它不仅仅是一台单纯的音乐播放器,在其背后支撑的 AI 技术才是整个产品的核心,也是各大公司觊觎物联网入口的最根本原因。经历了2017年的爆发式增长,到现在AI智能音箱已经成为最热门的硬件产品之一,因此各种客制化的产品如雨后春笋般的喷涌而出。

二、基于“RTL8723DS +”开发的智能音箱模块设计

鉴于市场的蓬勃发展,我们审时度势,推出基于“RTL8723DS +”开发的智能音箱模块设计,更加方便工程师的应用需求,注意 Amlogic/ 开发手册目前只面向 Rokid 开发者提供。如未注册成为Rokid 开发者,请先至 Rokid 官网注册成为开发者,具体请访问https://developer.rokid.com/。

1)开发板套件基本参数介绍

1.1. Rokid语音整体方案 通过接入Rokid智能语音服务,您可以为配有麦克风和扬声器的联网硬件设备添加语音交互体验,使得您的手机、电视、音箱等智能设备轻松拥有语音交互的能力。

· Rokid语音整体方案,融合了从前端硬件的远场拾音、降噪、回声消除等技术,到语音识别、语义理解、自然语言合成等AI技术和iot物联网技术,提供硬件到软件全链路解决方案,助力开发者快速实现产品的智能化。

· Rokid语音整体方案,还针对行业或者特定场景,提供行业和场景解决方案,包括传统制造行业,运营商以及互联网行业和智能音箱解决方案、儿童故事机解决方案、智能电视解决方案

同时,平台还提供了包括内容类、工具类和互动类等不同类型的垂直语音技能。您的设备接入Rokid后,即可使用众多丰富有趣的 Rokid 公有技能,您也可以为自己的设备创建个性化的私有技能。

1.2. 接入方案类型

· 全链路通用方案:包括前端语音激活/降噪以及 Rokid 语音识别服务和语音合成服务的相关能力。

· 基础语音模块:基础语语音服务的输出,包括语音识别服务和语音合成服务。

· 全开源方案:YODAOS系统,可根据厂商或者个人开发者的需求,灵活修改,也欢迎开发者一起建设。

· CPU: Amlogic A113X A53x4 up to 1.5Ghz

· Memory: 256MB DDR3 + 512MB Nand Flash

· Mic Array: PDM mic x 4 Audio:line out 3.5mm

· Network:802.11 a/b/g/n/ac

· Bluetooth: 4.1/BLE LED: RGB

· LED x 12

· DC in:USB-Type C 5V

► 方案方块图

funcUrl

► 原理方框图

other1Url

► 核心技术优势

1,支持实时快速、精确的云端识别和远场拾音, 5米距离识别准确率高达>92%。

2,识别输出支持流式格式,能够实时地得到当前识别的结果,根据字段判断是否返回最终结果。

3,为保证用户口音和生僻字、方言的识别,针对用户粒度配置误识别较高的纠错指令,通过app端的人工干预,进行识别的纠正。

4,支持通用领域识别和垂直领域定制识别,定期增加领域数据,快速迭代,持续提升识别率。

► 方案规格

·  模组尺寸小,满足小尺寸应用场景

· 工作温度-20℃+70℃;

· 工作电压3.8V-4.2V,建议4V供电;

· 支持数字音频和模拟音频,支持HR,FR,EFR,AMR语音编码;

· 支持802.11 b/g/n  2.4GHz

· 支持HT20/HT40模式

· 支持低功耗信标监听模式,低功耗接收模式,低功耗挂起模式

· 支持SWD调试端口访问保护和禁止模式

· Wi-Fi和共用同一天线

· 支持串口本地升级和远程固件升级(FOTA)



评论


相关推荐

技术专区

关闭