第二期【百度大脑新品体验】远场语音识别套件之开箱
goJhou 发布于2019-05-09 00:05 浏览:1954 回复:35
1
收藏
最后编辑于2019-07-09

很荣幸,在2019年我依旧在百度AI平台下茁壮成长,这次收到了来自百度的测试邀请,我将有机会拿到最新的前沿产品~为各位献上来自前线的战况~

我在过去和百度语音打交道的这些日子,曾遇到过很多问题,比如识别慢、精度差。自身原因和设备原因太多,举步艰难。我觉得一个非音频内行的人很难进一步提升在这一块的性能与质量。

但现在,百度语音正不断地完善,已经推出多种我非常适用的新东西,例如:

上个月刚上线的 百度语音识别极速版

传送门> http://ai.baidu.com/forum/topic/show/943032

该项能力经我自己特定样本测试,可以提高识别速度约3~9倍,在上侧传送门的测试样例中,最慢的普通版和最快的极速版耗时甚至相差24倍,可见该极速版,可谓是目前普通版的最佳替代方案了!

这次我将为各位带来的百度开发套件的新星啦

远场语音开发套件!

传送门> https://aim.baidu.com/product/b226a947-4660-4e27-83b4-877bf63b8627

经过了7天的新品体验,我从开箱、hello world、交叉编译三方面已经写下了3篇文章,欢迎各位来阅~

第二期【百度大脑新品体验】远场语音识别套件之开箱

> http://ai.baidu.com/forum/topic/show/943766

第二期【百度大脑新品体验】远场语音识别套件之hello world(mac篇)

> http://ai.baidu.com/forum/topic/show/943770

第二期【百度大脑新品体验】远场语音识别套件之交叉编译SampleCode

> http://ai.baidu.com/forum/topic/show/943771

开箱篇:

这是一款很不错的产品,就像之前的人脸开发套件一样,他能有效帮助想要落地语音识别的企业和个人开发者们快速开发出属于自己的业务产品。

在本次产品的规格中,有三种配置可选,依次是:

6+1环形麦阵列
4mic线性阵列
3mic三角阵列
他们各有各的应用场景,为了更好地提升各位未来的产品,一定要听我说完他们的优点喔!

 

6+1环麦阵列

6+1环形阵列由6颗麦克风围绕一圈,中间分布一颗组成,可实现:

  • 360°零死角环绕声场
  • 增强GSC声源定位及波束形成效果
  • 基于非线性消除的AEC技术

推荐用于智能音箱等智能家居产品。

像现在主流的天猫精灵、小米音箱,都是采用的环形6麦阵列喔!

还有像国外的amazon echo 采用了类似解决方案

 

他可以做到无死角的识别和声源定位喔!这还是值得玩一玩的~

 

线性4麦阵列

4mic阵列由4颗麦克风横向排列
阵型狭长占用空间小,可适配各种硬件结构设计。

推荐应用于智能电视、平板、以及空调、冰箱等传统白电产品。

 

 

三角麦克阵列

 

3mic阵列是由3颗麦克风三角形方式排列

  • 支持双音区,兼顾主/副驾的语音交互需求
  • 增强GSC声源定位及波束形成效果
  • 基于非线性消除的AEC技术

3mic也支持声源定位喔

 

 

本次我所收到的是4mic阵列套件呢。他也是带有声源定位的哦~

 

废话不多说,开箱开始!

首先这次开发套件的外包装精致小巧,方方正正的外包装有种扑面而来的低调奢华与神秘感,不知道各位有没有看过四驱兄弟呢?

 

真是侧漏着一股神秘的气息呢!揭开它的面纱,看看里面吧

包装盒内非常简单明了,一张3折页,简单的说明书,开发套件本尊及数据线和电源线。

说明书简单介绍了包装内容清单、开发板的接口示意图、硬件连接指南、测试方式和软件开发环境搭建引导,比较简单。

我们来看一下开发套件本身吧,本套件使用的开发板是来自深圳市百能达电子有限公司和百度联手打造的RK3308开发板,拥有128M的ram和128M的flash。cpu采用的是微芯瑞的rk3308,4核ARM Cortex-A35。

wifi方面仅支持2.4g频段,蓝牙支持到4.0。

在本套件上额外有一片wifi天线,所以wifi质量杠杠的。

麦克风可兼容上方的3种阵列。

数据线是usb-micro,主要用于adb调试。

所配套的是输出为12V2A的电源。

那以上就是本次拆箱的讲解啦,我可迫不及待把玩他了~我们下期再见

收藏
点赞
1
个赞
共35条回复 最后由goJhou回复于2019-07-09 12:32
#36goJhou回复于2019-07-09 12:32:18
#35 liguanghui2588回复
应该弄个视频看看这个模组的识别能力

哈哈哈,看视频多没意思,上AI市场整一套自己玩

0
#35liguanghui2588回复于2019-07-09 12:15:00
#34 goJhou回复
写啥?我的已经结贴了呀

应该弄个视频看看这个模组的识别能力

0
#34goJhou回复于2019-07-09 12:07:40
#33 蓝色的风339回复
加油写啊

写啥?我的已经结贴了呀

0
#33蓝色的风339回复于2019-07-09 10:58:46
#32 goJhou回复
[图片]

加油写啊

0
#32goJhou回复于2019-07-08 20:28:04
#31 AI最前线回复
征稿活动第二期已开放远场语音套件的申请借用产出评测,有兴趣的开发者关注第二期活动文章按文中要求申请。
展开

0
#31AI最前线回复于2019-07-08 16:49:04

征稿活动第二期已开放远场语音套件的申请借用产出评测,有兴趣的开发者关注第二期活动文章按文中要求申请。

0
#30goJhou回复于2019-05-26 17:40:03
#29 才能我浪费99回复
期待你后续的大作

哈哈,套件已经寄回去了~没后续了~

0
#29才能我浪费99回复于2019-05-26 06:38:29
#26 goJhou回复
体验新能力嘛,开源的代码,加SDK能玩出很多花头。定制化程序的价值远大于售价
展开

期待你后续的大作

0
#28小雨青青润无声回复于2019-05-24 09:03:02
#23 liguanghui2588回复
可以设置不一样的唤醒词

这么特别啊,好可爱

0
#27小雨青青润无声回复于2019-05-24 09:02:13
#9 177******01回复
好想要一个百度音响呀

我也很喜欢,打算得一个,但是估计还要等很久

0
#26goJhou回复于2019-05-20 21:31:39
#24 才能我浪费99回复
感觉不便宜啊 

体验新能力嘛,开源的代码,加SDK能玩出很多花头。定制化程序的价值远大于售价

0
#25wangwei8638回复于2019-05-20 11:12:31
#23 liguanghui2588回复
可以设置不一样的唤醒词

小鱼小鱼

0
#24才能我浪费99回复于2019-05-20 10:34:56
#13 goJhou回复
没有什么试用申请喔。可以从正规渠道购买 https://aim.baidu.com/product/b226a947-4660-4e27-83b4-877bf63b8627
展开

感觉不便宜啊 

0
#23liguanghui2588回复于2019-05-19 18:32:56
#21 goJhou回复
我家里有2个小度小度,但版本不同,一起叫一起响应

可以设置不一样的唤醒词

0
#22wangwei8638回复于2019-05-19 15:57:48
#21 goJhou回复
我家里有2个小度小度,但版本不同,一起叫一起响应

所以说远场近场区分,还是有需求的

0
#21goJhou回复于2019-05-18 21:29:55
#20 wangwei8638回复
嘿嘿,只是问问这个场景,好像小米音箱有在做,如果放几个音箱的话,只唤醒最近的那个,不然三个一起答应,多乱呐
展开

我家里有2个小度小度,但版本不同,一起叫一起响应

0
#20wangwei8638回复于2019-05-18 15:45:19
#19 goJhou回复
哈哈哈,我太穷了,高级的玩不来

嘿嘿,只是问问这个场景,好像小米音箱有在做,如果放几个音箱的话,只唤醒最近的那个,不然三个一起答应,多乱呐

0
#19goJhou回复于2019-05-17 22:38:04
#18 wangwei8638回复
客厅卧室厨房放3个小度,怎么响应

哈哈哈,我太穷了,高级的玩不来

0
#18wangwei8638回复于2019-05-17 14:15:47

客厅卧室厨房放3个小度,怎么响应

0
#16goJhou回复于2019-05-16 20:34:20
#15 liguanghui2588回复
这个10米以内识别也可以

当然,5米的悄悄话都能唤醒~

0
TOP
切换版块