基本概念
更新时间:2020-05-25
机器人
- 机器人是指在一个完整对话场景下的对话能力。通常按行业垂类划分(例如:小度智能音箱中的对话场景就是一个机器人)。
技能
- 技能是指在某一个对话场景下的对话能力(例如,小度智能音箱的点歌功能就是一个技能)。技能分为开发者自定义技能和UNIT平台预置技能。
- 自定义技能又分为「对话技能」、「问答技能」和「对话式文档问答技能」,完全由用户配置。
- 预置技能为UNIT平台预置的通用场景对话能力,部分预置技能目前支持添加词槽词典值来干预对话理解效果。
对话技能
- 对话技能在多轮对话中可以准确理解用户需求(意图)和实现需求的关键信息(词槽),适用于需要根据不同对话意图和词槽信息给出不同对话答复的对话场景。能够在一些特定的对话场景下高精准地理解并满足用户需求,提升用户体验和满意度。比如问天气技能、订火车票技能、听音乐技能等等。
问答技能
- 问答技能适用于问题问法多样,但答案相对固定的对话场景,不需要根据用户对话话语中的关键信息来设定不同的答复内容。比如针对各种规则制度、政策法规等信息的问答技能。
对话式文档问答
- 对话式文档问答主要适用于有大量业务文档积累的场景,用户只需要按照约定的文档格式整理文档后上传后,训练模型即可获得对话能力。比如:产品手册,企业行政、人事、财务等领域的制度文档等。
对话意图
- 对话意图(intent)是对话技能要理解的用户需求(例如用户说
换到中央台
,那对应电视控制技能技能下的对话意图就是换台
;北京天气
,对话意图是查天气)。定义对话技能下的对话意图时还需要设置对话意图关联的词槽(满足对话意图的必须条件),以及技能理解对话意图后给用户的回应。
词槽
- 是满足用户对话意图时的关键信息或限定条件,可以理解为用户需要提供的筛选条件。例如在查询天气时,词槽是地点和时间。
- 例如:
换到中央台
中的中央台
就是一个电视台词槽
,它会一定程度上影响系统对换台
这个对话意图的执行。
词典
- 每个词槽都需要对应一套词典,技能的专名词识别服务会结合词槽绑定的词典来识别用户问话中的词槽。您可以自行导入词典,对话技能进行词槽识别时,会优先考虑自定义词典中的词汇。
对话模板
- 对话模板是您给对话系统按具体语法、句式做出的示范,教它在某一个特定语法、句式中,该如何理解对话意图,哪个词是重要信息,对应的词槽、特征词是什么。
- 例如:
[D:sys_loc][D:sys_time]天气如何
,上述标注表示可以将所有满足[城市]+[时间]+天气如何
这一规则的query解析为WEATHERINFO对话意图。如北京今天天气如何?
,天津明天天气如何
等。 - 其中
[D:sys_loc]
表示所有城市词组成的集合,“[D:sys_time]”表示所有时间描述组成的集合。 - UNIT中一个对话模板也可以使用多个模板片段组成,支持按片段去匹配用户query,实现更强的对话意图泛化匹配能力,提高模板对用户query的召回率。
调优模式
-
调优模式是对话式文档问答测试时的模式之一,主要用于对当前训练的模型效果不满意时,通过“调优模式”对已有模型进行干预,从而达到更加满意的对话效果。 通常调优模式下会展现一个或者多个候选项。
- 当只有一个候选项且用户对候选项不满意时,可以通过对话进一步补充关键信息,也可以对文档进行调整;
- 当有多个候选项时,可以从中选择最符合当前问题的答案选项,并点击“确认”来保存;
- 当对已经调优过的答案不满意,且需要进一步调整时,可以通过“重新选择”来进行修改答案。 最后通过“生效”把干预结果生效到模型。
特征词
- 特征词表示具有某一类特征的词,通常被用于约束某条对话模板的匹配范围(例如,天气,天儿等类别关键词),同时提供一定限度的泛化能力(例如订机票对话中
从北京到上海
的到
就可以与去、飞
等助词一起作为特征词);活用特征词机制可以事半功倍的提高对话模板的精度和覆盖度。
特征词词典
- 某一类特征词的集合。
对话样本
- 对话样本就是真实对话场景下用户表达目的的句子,教它在用户说的具体句子里,该如何理解对话意图,哪个词是重要信息,对应的词槽是什么。
- 例如:通过对话样本标注告诉机器人“
三亚明天会不会下雨
”与“三亚明日会下雨吗
”都是询问天气的语句,其中“三亚
”是对应城市city这个词槽,“明日
”和“明天
”都是time词槽。 - 这样的训练越多,机器人的理解能力便越强,这与在学习语言中的人类孩童的学习方式也是十分相似的。
对话样本集
- 是管理对话样本的集合,类似文件夹的作用,可以把不同来源的对话样本放在不同的对话样集中,也可以把不同时间段获取的对话样本分在不同的对话样本集中。
问答对
- 问题与答案的组合,称之为问答对。问答对支持一对一、一对多、多对一和多对多;当某一个问题对中包含多个答案时,答案随机呈现。
标签
- 对问答对进行分类化的管理,可以打在问答技能的问答对上,可以按业务分类、问题所属业务部门等自己需要的维度来管理问答对,提高问答对的管理效率。也可以在机器人调用接口和问答技能的调用接口中传入标签信息,在特定标签范围内的问答对中匹配相似问题。
模型
- 是您配置对话逻辑、导入训练数据后通过UNIT平台内置的各种学习引擎训练出的技能核心文件,模型需生效至研发环境后才可发挥作用。
研发环境
- 可用于自定义技能(包括: 对话技能、问答技能、对话式文档问答技能)的定义、训练数据标注、技能训练、对话测试。部署在研发环境的技能模型可通过技能对话API被业务系统集成调用,进行联调测试,并根据效果评估进一步优化模型效果。
生产环境
- 当技能模型在研发环境多次训练优化,效果达到开发者上线要求后,可直接在UNIT平台购买稳定性更好、qps 配置更高的模型运行环境——生产环境,部署该技能模型,并通过生产环境对话API集成到自己的产品/系统中服务线上用户。
图谱知识库
- 知识图谱(Knowledge Graph)本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。更多知识图谱说明