我最亲爱的妈妈,该做晚饭了
我最亲爱的妈妈,我晚饭想吃饺子
我最亲爱的妈妈,饺子里不要香菜
我最亲爱的妈妈….
用过语音助手的你一定有过这样的体验,感觉每次跟机器对话的节奏都特别卡顿,因为每抛出一个问题都要喊一遍它的名字,也就是“唤醒词”。有时候“聊”的正开心呢,却发现手机或者音箱根本没有在听你说话。不少用户都对类似的状况印象深刻。
________________我是分割线___________________
更“自然”的人机交互方式
那么有没有更“聪明”的人机交互方式呢,请看百度董事长兼CEO李彦宏为大家打个样:
视频地址:https://v.qq.com/iframe/preview.html?vid=q0505hqxe7q&
正如李彦宏在百度世界大会上说的:“日常生活当中人和人进行交流的时候,不会拉着手才能说话,也不会每说一句话都叫一次对方的名字。”
不难想见,去掉唤醒词之后的人机交流体验会自然得多。
________________我是分割线___________________
免唤醒词语音交互
如视频所见,一旦进入语音交互环节,手机就不再需要“唤醒词”,也就是说,手机一直“醒着”,听你说话。
百度AI免唤醒词语音交互技术,具体来说是“tts播报场景下的全双工语音交互技术”会不间断地聆听用户的语音输入信号,并进行语音识别,在此步骤中利用VAD技术判断当前语音输入是否结束,关键点为聆听和识别并发进行,且聆听不会停止,防止遗漏用户的语音请求。
________________我是分割线___________________
听清你,听懂你
所谓“听话要听音”,收听语音指令就需要具备两个硬本领,一是“听清”、一是“听懂”。
日常使用语音助手的时候难免会遇到嘈杂的环境音干扰,比如视频中的食堂就餐就是一个经典场景。本套系统利用回声抵消技术去除智能设备本身输出的声音,利用噪声抑制技术来减少环境噪声影响。做到“听清”用户说话的基本要求。
一方面不能太“灵敏”,一有“风吹草动”就被干扰、做出动作;另一方面,又不能太“迟钝”,需要听清主人说的很多句话里到底哪句话才是“指令”。
后端服务对语音识别出来的内容进行语义分析,并根据智能设备当前上下文信息进行意图分析,判断是否为有效的语言交互数据。
同时根据上线设备当前状态和上下文信息,利用用户输入的语音信息,利用声纹等技术判断当前语音输入信号是否为有效输入。
________________我是分割线___________________
李彦宏同款语音交互?
手机百度抢先体验
这么聪明的语音交互技术,还不赶紧上线?!想问哪里可以get到李彦宏同款的,其实视频中已经露出了一些线索……
没错,无需唤醒词的语音交互已经可以在手机百度(语音版)App体验到啦!
在这里,你可以无间断地发出语音指令,比如“下一条”;
“大一点声”,调大语音播报的音量;
“介绍一下XXX”,用更自然的语言交流,获取更多信息:
——————————————————
抛开唤醒词的束缚,更自然地与机器进行对话,让“冷冰冰”的语音助手像真人一样聆听你、理解你,让我们共同创造一个更加智能、更加懂你的未来世界!
“当你的眼睛需要看别的地方,当你的手需要做别的事情的时候,你仍然可以自然地和机器、和手机、和各种各样的设备进行自然语言的对话,这是AI带给大家的方便。”
手机百度语音版下载链接:https://mo.baidu.com/mo/yuyinhome
本文来自百度AI,因社区限制,小幅删除部分内容。
评论区在聊天哇...
在儿童教育方面.android 的应用真的垃圾.全是广告.
安卓挺好,并没有感觉到ipad多好用。。。
好像有些道理哟~
案例很通俗呀~~
刚出来的东西肯定不是普通人能用的嘛.就像笔记本和大哥大一样
地球母亲会自动清理GC的.
哇~居然还有这样的数据。。
是在担心成本的问题么?消费者的购买力?
不过还没见到你的成果呀~嘿嘿~
已经消耗的差不多了。地球最多容纳150亿人口 现在已经一半多了
工业4.0不是已经在弄了。嘿嘿。不过啥呢
这些科技能民用推广还是不错的.但是.
地球几十万年都没毁.不会有事的.随便捣腾.
参加的活动真多,大神有什么思路上的启发?
是呀 叫中国工业博览会 还有个国际消费电子展 都挺不错的 呵呵呵
也有可能去其他星球哟~
是的从未来的角度来讲。实际上地球才是最重要的
嗯,不过从发展的角度来看,还是有可能飞跃的~
还有 动力势能-水力发电?