尊敬的百度AI开放平台用户:
感谢您长期以来对语音和语义技术的支持,我们将持续丰富相关的产品能力!
语音识别预置场景语义解析
本次上线,UNIT为语音识别预置场景提供了全新的语义解析服务,开发者可通过语音ASR的接口获取识别文本及全新场景的语义理解结果。覆盖场景也由原来的35个更新并增加至51个,在覆盖天气、航班、列车、打电话等语音原有预置场景的基础上,又扩充了属相、进制转换、时区查询、数值计算、电影、电视剧、卡通、NBA、团购、美食、外卖等场景。
场景示例:
天气:用户语音输入“北京明天天气”,通过一个接口,同时获取ASR识别的文本和UNIT解析出的语义,【意图】是“查询天气”、【词槽】“北京”和“明天”;
电话:用户语音输入“打电话给妈妈北京移动的号码”,通过一个接口,同时获取ASR识别的文本和UNIT解析出的语义,【意图】是“打电话”、【词槽】为“妈妈”、“北京”和“移动”;
航班:用户语音输入“明天从北京到上海的东航机票”,通过一个接口,同时获取ASR识别的文本和UNIT解析出的语义,【意图】是“订航班”、【词槽】为“北京”、 “上海”、“明天”和“东航”;
后续会逐步丰富更多场景语义解析能力,欢迎各位开发者多多向我们提出需求。
接入方式:
目前,这些场景已上线至AI开放平台,请您【点击访问】
在语音识别Android,iOS,Linux SDK中,设置PID为15373(输入法模型)即可开启场景语义解析。具体使用可参考协议文档:http://ai.baidu.com/docs#/ASR-Query-Protocol/top
语音识别与UNIT打通
除了预置的场景之外,语音ASR基于Android SDK也实现了和UNIT的打通,开发者在调用语音ASR和UNIT 时,一次数据交互就搞定了;其他系统的SDK和API也会在近期推出。
1、开发者只需将音频文件传给语音识别服务,就可以拿到语音识别和UNIT回复两个结果 ;
2、语音识别服务将识别后的文本内容传给UNIT,UNIT返回回复话术;
开发者同时使用两种服务的成本大大降低,无需分别调用后再在业务逻辑层结合;除此之外,SDK的设计确保了只需要语音识别的开发者不受到影响,而无论是增加语义部分功能还是移除语义部分功能只需要修改参数,无需更换SDK。
使用方法:
目前,SDK和相关文档均已发布至AI开放平台官网,开发者可直接下载使用:
SDK下载连接:http://ai.baidu.com/sdk#asr
在语音识别Android SDK中,设置PID为15374(输入法模型)即可开启语音识别UNIT打通。详细在线文档链接:http://ai.baidu.com/docs#/ASR-Android-SDK/top
了解更多语音识别技术,请访问:https://ai.baidu.com/tech/speech/asr
了解更多UNIT相关内容,请访问:https://ai.baidu.com/tech/unit
如需合作咨询可点击屏幕右下角标志,提交具体咨询信息;或可进入AI开发者社区,进行沟通交流。