感谢您长期以来对语音和语义技术的支持,我们将持续丰富相关的产品能力!
语音识别预置场景语义解析
本次上线,UNIT为语音识别预置场景提供了全新的语义解析服务,开发者可通过语音ASR的接口获取识别文本及全新场景的语义理解结果。覆盖场景也由原来的35个更新并增加至51个,在覆盖天气、航班、列车、打电话等语音原有预置场景的基础上,又扩充了属相、进制转换、时区查询、数值计算、电影、电视剧、卡通、NBA、团购、美食、外卖等场景。
场景示例:
天气:用户语音输入“北京明天天气”,通过一个接口,同时获取ASR识别的文本和UNIT解析出的语义,【意图】是“查询天气”、【词槽】“北京”和“明天”;
电话:用户语音输入“打电话给妈妈北京移动的号码”,通过一个接口,同时获取ASR识别的文本和UNIT解析出的语义,【意图】是“打电话”、【词槽】为“妈妈”、“北京”和“移动”;
航班:用户语音输入“明天从北京到上海的东航机票”,通过一个接口,同时获取ASR识别的文本和UNIT解析出的语义,【意图】是“订航班”、【词槽】为“北京”、 “上海”、“明天”和“东航”;
后续会逐步丰富更多场景语义解析能力,欢迎各位开发者多多向我们提出需求。
接入方式:
目前,这些场景已上线至AI开放平台https://console.bce.baidu.com/ai/?_=1551839296834&fromai=1#/ai/speech/app/detail~appId=843039
在语音识别Android,iOS,Linux SDK中,设置PID为15373(输入法模型)即可开启场景语义解析。具体使用可参考协议文档http://ai.baidu.com/docs#/ASR-Query-Protocol/top
语音识别与UNIT打通
除了预置的场景之外,语音ASR基于Android SDK也实现和UNIT打通,开发者在调用语音ASR和UNIT 时,一次数据交互就搞定了;其他系统的SDK和API也会在近期推出。
1、开发者只需将音频文件传给语音识别服务,就可以拿到语音识别和UNIT回复两个结果 ;
2、语音识别服务将识别后的文本内容传给UNIT,UNIT返回回复话术;
开发者同时使用两种服务的成本大大降低,无需分别调用后再在业务逻辑层结合;除此之外,SDK的设计确保了只需要语音识别的开发者不受到影响,而无论是增加语义部分功能还是移除语义部分功能只需要修改参数,无需更换SDK。
使用方法:
目前,SDK和相关文档均已发布至AI开放平台官网,开发者可直接下载使用:
SDK下载连接:http://ai.baidu.com/sdk#asr
在语音识别Android SDK中,设置PID为15374(输入法模型)即可开启语音识别UNIT打通。详细在线文档链接:http://ai.baidu.com/docs#/ASR-Android-SDK/top
每种设计方案都有其特定适用场景,有利有弊
发现越来越便捷了
整合的很好
http://xueli2.wikidot.com
http://xueli2.wikidot.com/1
http://xueli2.wikidot.com/2
http://xueli2.wikidot.com/3
http://xueli2.wikidot.com/4
http://xueli2.wikidot.com/5
http://xueli2.wikidot.com/6
http://xueli2.wikidot.com/7
http://xueli2.wikidot.com/8
http://xueli2.wikidot.com/9
http://xueli2.wikidot.com/10
http://xueli2.wikidot.com/11
http://xueli2.wikidot.com/12
http://xueli2.wikidot.com/13
http://xueli2.wikidot.com/14
http://xueli2.wikidot.com/15
http://xueli2.wikidot.com/16
http://xueli2.wikidot.com/17
http://xueli2.wikidot.com/18
http://xueli2.wikidot.com/19
http://xueli2.wikidot.com/20
http://xueli2.wikidot.com/21
语音更方便,不用打字。
可以构建一个专业的服务机器人
新功能上线了,期待更多新功能
请问iOS版SDK的什么时候可以上线?
请问iOS版SDK的什么时候可以上线?
请问iOS版SDK的什么时候可以上线?
可以构建一个专业的服务机器人
一般unit会和自己的服务器交互.如果再能打通unit回调服务,连着oauth授权一起确认用户信息.那完美了.可以少从服务端走很多路.
不算语音ASR部分的时间的话,语义部分的时间大概在200ms左右,语音ASR的部分,和开放平台上的时间一致
绝对新功能
请问语音语义接口返回结果的时间范围是多少?
哇呜,新功能上线,不错
这个功能上线挺快的嘛,为百度点赞,祝百度AI越来越好
如有问题欢迎留言咨询