在电话客服场景里,用户和机器人交流的过程中,经常会出现沉默、打断机器人、噪声等情况,机器人在应对这些异常情况的时候,需要语音和语义理解技术进行处理,才能实现用户和机器人的流畅交谈。而这些能力的获取与应用,也是企业智能对话项目落地过程中需要解决的难题之一。
为此,UNIT带来了全新的语音语义一体化解决方案,帮助企业解决语音交互过程中的难题。
【一段视频快速了解语音语义一体化的强大能力】
语音语义一体化是针对电话客服对话场景的技术方案,可用于呼叫中心智能客服等业务。整个方案包含以下内容:
(1)降低集成开发成本
提供语音识别、语义理解、对话流程控制、知识库、语音合成的打通方案,全双工对话能力,一体化的部署方案,省去开发者对各环节自行调用、拼装的学习成本以及二次开发成本。
(2)标准协议快速接入
提供基于unimrcp框架开发的mrcpserver服务接入包,通过标准协议适配不同呼叫中心设备(主流的freeswitch、avaya、及基于mrcp标准协议自主研发的呼叫中心设备)。
(3)场景定制服务提升效果
方案中自带基于百度大脑呼叫中心下的通用ASR、语义纠错,打断策略,TTS模型,也可以基于开发者的业务场景,提供模型定制训练服务,定向提升业务准确率。
(4)极少量开发,轻松实现对话流程
提供Taskflow配置管理能力,开发者可在梳理业务流程后,通过少量代码快速配置对应的对话流程,后续可直接零代码在UNIT平台上进行拖拽式配置。
【语音语义一体化方案能力解读】
(1)语音识别ASR
采用领先的百度语音技术,实时将音频流转识别出文本,并自动识别断句。
(2)全双工对话能力
建立通用机制,组织多模块协同工作,实现双通道数据(文本、事件信号)实时分发及处理。
(3)纠错
根据场景相关词汇生成纠错候选,利用GBDT模型对获选打分排序,最后通过beam search解码出最优纠错结果。
(4)打断
采用分类模型实现,判断是否满足打断条件,并下发打断信号,可支持用户自定义语料的模型训练。
(5)静默及反问
在设定时间内用户未回复情况下,机器人可自动反问。可支持用户对时间条件、机器人反问话术进行配置。
(6)挂机、转人工
定义标准事件信号:挂机、转人工。用户可通过配置、或简单二次开发完成判断条件的设定。
(7)对话理解
基于UNIT强大的语义理解能力,从实时文本中,解析用户意图。
(8)对话逻辑引擎
以可编程的方式构业务建对话逻辑。
(9)语音合成TTS
基于深度神经网络技术,提供高度拟人,流畅自然的语音合成服务,便于应用、设备开口说话,更具个性。
【如何获取语音语义一体化能力】
开发者可以进入UNIT官网——解决方案——语音语义一体化方案页面,了解技术详情并体验真实对话样例。
1、了解方案详情
2、真实对话样例的体验
收藏