语音语义一体化全新升级,一次数据交互全搞定
AI最前线 发布于2019-03-07 浏览:9154 回复:19
4
收藏
最后编辑于2021-08-20

感谢您长期以来对语音和语义技术的支持,我们将持续丰富相关的产品能力!

语音识别预置场景语义解析

本次上线,UNIT为语音识别预置场景提供了全新的语义解析服务,开发者可通过语音ASR的接口获取识别文本及全新场景的语义理解结果。覆盖场景也由原来的35个更新并增加至51个,在覆盖天气、航班、列车、打电话等语音原有预置场景的基础上,又扩充了属相、进制转换、时区查询、数值计算、电影、电视剧、卡通、NBA、团购、美食、外卖等场景。

场景示例:

天气:用户语音输入“北京明天天气”,通过一个接口,同时获取ASR识别的文本和UNIT解析出的语义,【意图】是“查询天气”、【词槽】“北京”和“明天”;

电话:用户语音输入“打电话给妈妈北京移动的号码”,通过一个接口,同时获取ASR识别的文本和UNIT解析出的语义,【意图】是“打电话”、【词槽】为“妈妈”、“北京”和“移动”;

航班:用户语音输入“明天从北京到上海的东航机票”,通过一个接口,同时获取ASR识别的文本和UNIT解析出的语义,【意图】是“订航班”、【词槽】为“北京”、 “上海”、“明天”和“东航”;

后续会逐步丰富更多场景语义解析能力,欢迎各位开发者多多向我们提出需求。

接入方式:

目前,这些场景已上线至AI开放平台https://console.bce.baidu.com/ai/?_=1551839296834&fromai=1#/ai/speech/app/detail~appId=843039

在语音识别Android,iOS,Linux SDK中,设置PID为15373(输入法模型)即可开启场景语义解析。具体使用可参考协议文档http://ai.baidu.com/docs#/ASR-Query-Protocol/top

语音识别与UNIT打通

除了预置的场景之外,语音ASR基于Android SDK也实现和UNIT打通,开发者在调用语音ASR和UNIT 时,一次数据交互就搞定了;其他系统的SDK和API也会在近期推出。

1、开发者只需将音频文件传给语音识别服务,就可以拿到语音识别和UNIT回复两个结果 ;

2、语音识别服务将识别后的文本内容传给UNIT,UNIT返回回复话术;

开发者同时使用两种服务的成本大大降低,无需分别调用后再在业务逻辑层结合;除此之外,SDK的设计确保了只需要语音识别的开发者不受到影响,而无论是增加语义部分功能还是移除语义部分功能只需要修改参数,无需更换SDK。

使用方法:

目前,SDK和相关文档均已发布至AI开放平台官网,开发者可直接下载使用:

SDK下载连接:http://ai.baidu.com/sdk#asr

在语音识别Android SDK中,设置PID为15374(输入法模型)即可开启语音识别UNIT打通。详细在线文档链接:http://ai.baidu.com/docs#/ASR-Android-SDK/top

收藏
点赞
4
个赞
共19条回复 最后由bidu_goseaside回复于2021-08-20
#20bidu_goseaside回复于2021-08-20

每种设计方案都有其特定适用场景,有利有弊

0
#19xin8feng回复于2021-03-20

https://weibo.com/ttarticle/p/show?id=2309404616783364489287
https://weibo.com/ttarticle/p/show?id=2309404616789622653399
https://weibo.com/ttarticle/p/show?id=2309404616791526867060
https://weibo.com/ttarticle/p/show?id=2309404616792969707847
https://weibo.com/ttarticle/p/show?id=2309404616823755899067
https://weibo.com/ttarticle/p/show?id=2309404616829275603273
https://weibo.com/ttarticle/p/show?id=2309404616830353277029
https://weibo.com/ttarticle/p/show?id=2309404616831338938685
https://weibo.com/ttarticle/p/show?id=2309404616832236781643
https://weibo.com/ttarticle/p/show?id=2309404616833021116885
https://weibo.com/ttarticle/p/show?id=2309404616833956446308
https://weibo.com/ttarticle/p/show?id=2309404616834933719381
https://weibo.com/ttarticle/p/show?id=2309404616836162388281
https://weibo.com/ttarticle/p/show?id=2309404616837869469713
https://weibo.com/ttarticle/p/show?id=2309404616850255249487
https://weibo.com/ttarticle/p/show?id=2309404616849496342897
https://weibo.com/ttarticle/p/show?id=2309404616848661676135
https://weibo.com/ttarticle/p/show?id=2309404616847956770927
https://weibo.com/ttarticle/p/show?id=2309404616853564817574
https://weibo.com/ttarticle/p/show?id=2309404616854785359910
https://weibo.com/ttarticle/p/show?id=2309404616855494197466
https://weibo.com/ttarticle/p/show?id=2309404616856416944328
https://weibo.com/ttarticle/p/show?id=2309404616856949358981
https://weibo.com/ttarticle/p/show?id=2309404616857544949837
https://weibo.com/ttarticle/p/show?id=2309404616858027557048
https://weibo.com/ttarticle/p/show?id=2309404616858577011257
https://weibo.com/ttarticle/p/show?id=2309404616858988052729

 

0
#18wangwei8638回复于2021-01-22

发现越来越便捷了

0
#17wangwei8638回复于2021-01-22

整合的很好

0
#16铃戌动质葡回复于2021-01-20

http://xueli2.wikidot.com
http://xueli2.wikidot.com/1
http://xueli2.wikidot.com/2
http://xueli2.wikidot.com/3
http://xueli2.wikidot.com/4
http://xueli2.wikidot.com/5
http://xueli2.wikidot.com/6
http://xueli2.wikidot.com/7
http://xueli2.wikidot.com/8
http://xueli2.wikidot.com/9
http://xueli2.wikidot.com/10
http://xueli2.wikidot.com/11
http://xueli2.wikidot.com/12
http://xueli2.wikidot.com/13
http://xueli2.wikidot.com/14
http://xueli2.wikidot.com/15
http://xueli2.wikidot.com/16
http://xueli2.wikidot.com/17
http://xueli2.wikidot.com/18
http://xueli2.wikidot.com/19
http://xueli2.wikidot.com/20
http://xueli2.wikidot.com/21

0
#15rose20135188回复于2019-06-02

语音更方便,不用打字。

0
#14177******01回复于2019-05-30

可以构建一个专业的服务机器人

1
#13177******01回复于2019-05-29

新功能上线了,期待更多新功能

0
#12177******01回复于2019-05-29

请问iOS版SDK的什么时候可以上线?

0
#11huixiangnanian回复于2019-04-22

请问iOS版SDK的什么时候可以上线?

0
#10huixiangnanian回复于2019-04-22

请问iOS版SDK的什么时候可以上线?

0
#9wangwei8638回复于2019-04-19

可以构建一个专业的服务机器人

0
#8卡农LLLL回复于2019-03-18

一般unit会和自己的服务器交互.如果再能打通unit回调服务,连着oauth授权一起确认用户信息.那完美了.可以少从服务端走很多路.

0
#7johnnywaiting回复于2019-03-12
#5 凡氏科技回复
请问语音语义接口返回结果的时间范围是多少?

不算语音ASR部分的时间的话,语义部分的时间大概在200ms左右,语音ASR的部分,和开放平台上的时间一致

0
#6liguanghui2588回复于2019-03-12

绝对新功能

0
#5凡氏科技回复于2019-03-10

请问语音语义接口返回结果的时间范围是多少?

0
#4rose20135188回复于2019-03-09

哇呜,新功能上线,不错

0
#3mlsodf回复于2019-03-07

这个功能上线挺快的嘛,为百度点赞,祝百度AI越来越好

1
#2伊茨米可回复于2019-03-07

如有问题欢迎留言咨询

0
TOP
切换版块