Solutions 软件

三蓝牙智能语音方案

日期: 2019-02-27
浏览次数: 86

背景与定位

2017年国内外的AI公司都加入了给传统消费类电子产品加入AI的热潮中。AI+语音从火热的音箱产品蔓延到另一大品类:耳机。耳机类的产品开始了集体智能化的道路。特别是苹果发布其Airpods产品,通过双击直接换出Siri语音助手的功能展示出耳机作为AI能力出口的可能性。AirPods发布一年后,NPD集团关于美国市场蓝牙耳机销售报告显示,AirPods在不到一年的时间就占据同类产品销售总额的85%,且满意度高达98%,成为最受欢迎的苹果产品之一。分析师认为,向Siri发出语音指令的全新交互方式让AirPods有了区别于其他蓝牙耳机的产品定位,是其取得成功的重要因素之一。随着智能语音趋势在全球范围内的全面发酵,其他巨头们也开始将更多精力放在耳机产品上。

 

一系列的新品被陆续发布:三星的Gear IconX,Google Pixel Buds,Bragi The Dash Pro,LINE Mars,科大Mobius等等。这些产品都围绕健康记录、音乐播放、语音助手、语音对话翻译、出行导航、出行交通安全等功能施展拳脚。智能耳机背后隐藏的不仅仅是用AI赋能耳机的简单逻辑,而是AI服务和能力向移动化、个人化、社交化方向发展。智能耳机带来的是私人个性化的移动AI服务,而这种随身随时随地的使用用需求,最终催生的将是适合全场景的高度泛用型的AI。

 

对现有的智能耳机产品而言,一切才刚刚开始。纵观目前已有的智能耳机产品,主要功能点集中在几个方面:

1. 与语音助手的整合:集成或支持Siri,Google Assistant,Alexa等。

2. 支持生物识别运动跟踪;

3. 多语言的实时翻译;


设计理念

尽管现有智能耳机中的大多数都致力于利用全语音交互与更多垂直场景融合,但与成为“个人化的泛用型AI设备”还有相当远的距离。主要表现在以下几个方面:

1. 人与人之间的交互方式不完美,如对话时,一方要佩戴对方的耳机,有卫生和人数限制缺陷。

1. 不能满足更多的场景,如多人会议,行车驾驶等场景。

 

为了实现个人化的泛用型AI这一目的,我们推出了可以满足兼容个人化、移动化以及社交化的泛用型三蓝牙智能语音方案。该方案可以满足更多的移动商务交互的场景和应用。

 

方案与功能介绍

为满足个人化,三蓝牙耳机依旧采用传统TWS(True Wireless Stereo)的方式,可以在个人自己使用时可以听音乐、通过语音助手查询信息。为满足移动的需求,三蓝牙耳机也配备有为耳机充电的收纳盒,可以满足用户全天候的使用时长。为满足多人交互以及在不佩戴耳机同时的使用场景,通过收纳盒直接可以让多个用户实现语音沟通。所以该方案的设计理念就是:在不改变现有用户熟悉的产品形态的前提下,满足个人化的泛用型AI语音交互设备。

三蓝牙®智能语音方案

三蓝牙智能语音方案系统的拓扑结构图如下:

系统前端表现形态与市面上主流的TWS产品完全一致,这样用户使用产品的学习成本大大降低甚至几乎为零。与传统TWS产品不一样的地方就是将充电功能的收纳盒也升级为蓝牙智能设备,给充电盒本身赋予语音交互的功能。而这一功能是通过增加高性能无线蓝牙芯片,大功率解码芯片,内置扬声器,以及单麦克风或者多麦克风实现的。

 

同时双耳内的主副耳机也被全面升级,但对用户是透明的。主耳机与充电收纳盒保持相同地位,即负责与蓝牙主设备通信,但同一时间只有一个保持工作状态。副耳机可以保持与主耳机或者充电收纳盒的数据与音频连接,在主耳机与充电收纳盒工作切换的时刻,迅速切换到保持工作状态的一方。

 

整个硬件方案配合智能手机端的服务程序一起使用,主耳机或者充电收纳盒与智能手机通过蓝牙无线连接。服务程序再通过互联网与云端各种AI平台对接,这一结构更是主流智能语音耳机采用的方式,对用户而言无任何变化。现今智能手机已经非常普及而Wi-Fi或者4G的上网成本已经非常低廉,及时用户出国也不会因为移动网络的费用而担心。

 

运用三蓝牙方案的架构可以很好实现以下主要功能:

  •  个人听音乐

  •  个人拨打或接听电话

  •  个人语音助手

  •  个人语音对话

  •  个人语音翻译

  •  多人语音助手的外放

  •  多人语音对话的外放

  •  多人语音翻译的外放

  •  多人电话会议

 

这样看似普通的个人语音智能耳机,可以扩大到多人使用的场景,甚至可以解决个人长期佩戴耳机带来的耳部不适等问题。


方案应用场景

典型的应用模式包括且不限于:

  • 个人模式:听音乐,拨打电话,导航,信息查询,服务预订,翻译,外  语学习,智能运动记录与引导,语音记录

  • 多人模式:听音乐,非接触式的对话翻译,多人电话会议,多人会议记录,外语学习,语音多人互动游戏

 

这样无论是个人还是多人都可以体验到智能语音产品带来的全新体验,是满


足个人化的泛用型AI语音交互的全新方案。


三蓝牙®智能语音方案



以用户出行国外商务旅行为例子,用户通过佩戴耳机查询机票和目的地天气等信息,当用户在整理行装时,又可以将耳机放入充电收纳盒播放音乐或者呼叫出租车,释放双手和双耳。当在旅途中又可以佩戴耳机聆听音乐。到达目的地后,可以佩戴一个耳机将另外一个耳机放入收纳充电盒充当与人交互的翻译设备,从而避免强行要求他人佩戴自己耳机的尴尬。与会的场景下,可以多人对话进行翻译,同时还可以记录会议的内容。这样一款产品可以满足个人与多人的交互需求,通过耳机与充电盒互为补充的方式实现各种场景的切换,以应对个人使用,旅程路上,商务会晤等多种应用环境。


方案技术特性与指标

三蓝牙语音方案采用AIROHA AB1526P系列芯片为硬件核心,配套智能语音软件实现个人语音助手,语音翻译等功能。

 AB1526P芯片是全新的单芯片双模芯片,更可以支持蓝牙5.0认证标准。其功能支持如下:

  • Bluetooth 5.0

  • EDR全支持

  • A2DP 1.3

  • HFP 1.7

  • HSP 1.2

  • AVRCP 1.6

  • SPP 1.2

  • 多点HFP和A2DP

  • 96MIPS 双MAC DSP协处理器

  • 双麦克风降噪与回声抑制

  • 可编程EQ

  • 语音通话,语音提示可定制化

  • 支持语音命令

  • 内置AAC LC解码器

 

三蓝牙®智能语音方案



三颗AB1526P分别部署在左耳(Left CH)、右耳(Right CH)以及充电收纳盒内(Container Box)。左耳与右耳的构成基本一致都包含一颗主芯片,电池,外部IO接口,LED指示灯,喇叭以及麦克风。充电收纳盒内含有一个主芯片,两路麦克风,扩音喇叭,IO接口,LED指示灯和电池,特别的还包含一个负责执行工作模式切换的微处理器(Working Mode Change Unit,WMCU)用来切换左耳与充电收纳盒的工作状态。

 

双耳部分有效工作距离可以达到10米左右,而充电收纳盒可以工作在更远的距离(20米)可以满足多人在场的情景。

 

耳机一次充满电可连续工作5-6个小时,而收纳盒在非工作状态可以提供3次左右耳机的充电周期。如果收纳盒自行连续工作也可以提供2次左右充电。这个和最终产品中内置电池的容量也有关系。

 

充电电压在4.5-6.5V之间,容差为正负5%。可以用常规充电的方式为其充电。

 

工作在BD模式时,最大传输功率为6dBm,接收功率-93dBm;EDR时传输功率提高赋值1.5dB。低功耗工作时,传输功率也仅为6dBm。

 

音频模数转换的SNR为90dB,THD+N为-55~-68dB,模拟增益42dB,麦克风级数为0.8Vpp。可以确保高清的音质传输与录音。支持双模拟输入接口,双模拟输出接口以及数字音频接口可以采用灵活的外部器件方案使得无论成本还是应用场景更加多样化。音频输出还支持SPDIF(48-96KHz)。同时亦支持数字麦克风DMIC接口。


相关方案 / Video More
分享:
Copyright ©2019 - 2020 零零幺深圳科技有限公司 001ai(Shenzhen) Technology Co.,Ltd,
犀牛云提供企业云服务