我最亲爱的妈妈,该做晚饭了
我最亲爱的妈妈,我晚饭想吃饺子
我最亲爱的妈妈,饺子里不要香菜
我最亲爱的妈妈….
用过语音助手的你一定有过这样的体验,感觉每次跟机器对话的节奏都特别卡顿,因为每抛出一个问题都要喊一遍它的名字,也就是“唤醒词”。有时候“聊”的正开心呢,却发现手机或者音箱根本没有在听你说话。不少用户都对类似的状况印象深刻。
________________我是分割线___________________
更“自然”的人机交互方式
那么有没有更“聪明”的人机交互方式呢,请看百度董事长兼CEO李彦宏为大家打个样:
视频地址:https://v.qq.com/iframe/preview.html?vid=q0505hqxe7q&
正如李彦宏在百度世界大会上说的:“日常生活当中人和人进行交流的时候,不会拉着手才能说话,也不会每说一句话都叫一次对方的名字。”
不难想见,去掉唤醒词之后的人机交流体验会自然得多。
________________我是分割线___________________
免唤醒词语音交互
如视频所见,一旦进入语音交互环节,手机就不再需要“唤醒词”,也就是说,手机一直“醒着”,听你说话。
百度AI免唤醒词语音交互技术,具体来说是“tts播报场景下的全双工语音交互技术”会不间断地聆听用户的语音输入信号,并进行语音识别,在此步骤中利用VAD技术判断当前语音输入是否结束,关键点为聆听和识别并发进行,且聆听不会停止,防止遗漏用户的语音请求。
________________我是分割线___________________
听清你,听懂你
所谓“听话要听音”,收听语音指令就需要具备两个硬本领,一是“听清”、一是“听懂”。
日常使用语音助手的时候难免会遇到嘈杂的环境音干扰,比如视频中的食堂就餐就是一个经典场景。本套系统利用回声抵消技术去除智能设备本身输出的声音,利用噪声抑制技术来减少环境噪声影响。做到“听清”用户说话的基本要求。
一方面不能太“灵敏”,一有“风吹草动”就被干扰、做出动作;另一方面,又不能太“迟钝”,需要听清主人说的很多句话里到底哪句话才是“指令”。
后端服务对语音识别出来的内容进行语义分析,并根据智能设备当前上下文信息进行意图分析,判断是否为有效的语言交互数据。
同时根据上线设备当前状态和上下文信息,利用用户输入的语音信息,利用声纹等技术判断当前语音输入信号是否为有效输入。
________________我是分割线___________________
李彦宏同款语音交互?
手机百度抢先体验
这么聪明的语音交互技术,还不赶紧上线?!想问哪里可以get到李彦宏同款的,其实视频中已经露出了一些线索……
没错,无需唤醒词的语音交互已经可以在手机百度(语音版)App体验到啦!
在这里,你可以无间断地发出语音指令,比如“下一条”;
“大一点声”,调大语音播报的音量;
“介绍一下XXX”,用更自然的语言交流,获取更多信息:
——————————————————
抛开唤醒词的束缚,更自然地与机器进行对话,让“冷冰冰”的语音助手像真人一样聆听你、理解你,让我们共同创造一个更加智能、更加懂你的未来世界!
“当你的眼睛需要看别的地方,当你的手需要做别的事情的时候,你仍然可以自然地和机器、和手机、和各种各样的设备进行自然语言的对话,这是AI带给大家的方便。”
手机百度语音版下载链接:https://mo.baidu.com/mo/yuyinhome
本文来自百度AI,因社区限制,小幅删除部分内容。
不....前面部分我躲外面吹冷气了...里面太热了.起码30度.
哈哈,是不是百看不厌呀?
哈哈,那也比别的开发者占便宜了,听说你形容的很成都?用火锅店比喻的现场?
剩下的就是以前的东西又拿来推广讲解和第三方厂商的展示大会...
最后拉他们官方的技术问了一大堆问题.可惜他们要赶着去飞机了.
那也能学到很多知识,来社区做分享哟
能主讲就牛逼了..可惜不是..我就坐下面听听.
呀呀呀,这是主讲去了?
明天去duer的现场.能加ai社区的积分就更棒了..虽然是幻想.
不止是仰望,还要积极向7叔靠拢
这个太难了,笔墨做不到
相信AI的产品,但是这个运营是和预算有关系的。。
每天坚持发技术分享就能赶上了 哈哈哈
担心啥 明年肯定会更丰富 难道你不相信AI嘛 嘿嘿
仰望的对象了。。。
嗯,他最厉害了。。。领袖。。。哈哈哈哈
应该是7叔.目前看7叔积分好像最高?
那肯定不会是我先到
会不会就一个mac啊.然后你们谁先到就谁领.完蛋.
嗯,同样比较担心,数量有限。。