资讯 社区 文档
重磅发布 | 远场语音开发套件邀您体验
发布日期:2019-01-16 03:09浏览量:1557次

百度AI-人体分析

尊敬的百度AI开放平台用户:

随着智能语音交互技术的发展,与音箱、平板、机器人、车辆等智能机器设备直接对话交互逐渐成为日常。百度语音交互端到端方案,引领技术变革,已应用到很多领域,服务于千家万户。小度系列音箱极致的唤醒、识别体验,创维电视流畅自然的语音交互能力,以及Apollo小度车载OS安全便捷的语音操控功能都是依托于百度语音交互端到端方案来实现的。

百度语音交互端到端方案从用户交互端到云端模型全链条定制,解决了远场语音交互识别不稳定、错误率高等应用问题。而基于此方案研发定制的远场语音开发套件,承载了语音交互端到端方案技术优势,可供开发者与硬件设备厂商快速有效地进行研发评估与设备选型。

 

远场语音开发套件包括如下硬件模组

●  多种麦克风阵列选型:环形6+1麦、线形4麦、三角形3麦三种麦克风阵型,适配于智能音箱、智能家居、智能机器人、车载设备等多种远场语音交互场景;

●  超强算力芯片:四核A35,强悍的计算能力,提供差异化音视频编解码能力,满足不同开发者的定制化开发需求;

●  先进的信号处理算法:基于非线性消除的AEC技术、增强GSC的波束生成技术,支持噪声消除、方向固定的麦克风阵列算法。

 

以及搭载在其上的语音交互SDK,包含语音唤醒、识别、合成能力

●  高精度的语音唤醒:基于DeepCNN的唤醒词整词置信度技术,纯端侧唤醒词检测,高精度低延迟超低误报,5米也能轻松唤醒;

●  高精准的语音识别:基于Deep Peak2模型,支持多方言、中英文混说识别,系统稳定性更强、准确率更高、解码速度更快;

●  流畅自然的语音合成:基于拼接和WaveNet相结合的技术方案,实现具备丰富情感、高度拟人、流畅自然的语音合成体验。

 

远场语音开发套件,提供完整的硬件模组和软件开发套件,便于接入及方案评估;标准Android原生ROM,方便扩展和定制;135米远场有效拾音,支持回声消除、360度声源定位等,高精度的端云一体化远场语音方案。软硬一体完整方案,可以最大程度高效地支持开发者、智能硬件生产商进行开发评估和设备选型。主要应用于智能音箱、智能电视等家居产品、智能平板、机器人、车载设备等多种需要远场语音交互的场景,并已在150+款产品上进行落地。

 

如需购买使用,请在远场语音开发套件页面提交合作咨询,非常期待您的咨询和使用!

技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术