UNIT2.0对话模板标注说明
置顶
tiancorn 发布于2018-01-31 16:12 浏览:2753 回复:4
0
收藏
最后编辑于2018-07-10

对话模板是对用户需求表达的一种规则抽象,配置好对话模板,可以快速识别不同表达方式的用户需求。

比如,订一下北京到上海的火车票,多谢了,我们就首先可以从中提取出订票意图的词槽表达。

接着我们还可以抽象出一些特征词,比如把我需要、我要定 都抽象为表达预订的特征词kw_booking,把到、去、往、回归纳为kw_to特征词,这些特征词在新建模板前就可以新建好,并添加好尽量多的词典值,这样能让一条模板可以覆盖尽量多的用户query。而有些即不能归纳为词槽,也不能归纳为特征词,但又经常可能在用户的一句话里出现的,可以用通配符去表达。比如这句话里的多谢了,就可以用通配来表达。

了解完上面的基本概念后,我们来看UNIT2.0中对话模板更强大的用法,多个模板片段组成一个对话模板,每个模板片段都可以由词槽、特征词、特定文本单独或组合而成,而且多个模板片段可以是无须的,也可以是有序的。顺序设为0就表示这个模板片段可以出现在用户query中的任意位置。而非0的,必须按照数字顺序在query中出现。此外还可以设置一个模板片段是否必须在用户query中出现。

看这个对话模板,有5个模板片段, 按照顺序的意思就是 什么时间要订从哪到哪的票,这里出发时间的顺序设为0,表示出发时间可以在用户query中的任何位置,而下面的要定从拿到拿的票 这是固定顺序的。当然用户的一句话里不一定说的这么全,只要有 我要定、火车票 这样的特征词就能确定用户是要订票的意图了——必须匹配设为”是”。其他的信息都可以在后续的对话中让用户去澄清补充的。

最后大家还要了解的一个概念是阈值,它是说当前模板配置的词槽、特征词 占用户query的长度比例,当只有这个比例达到这个阈值的时候,我们才会判定用户的query就是这个模板所表示的意图。大家会需要经常调整这个阈值,调的太低,可能会造成很多误召回,太高可能会导致召回率很低。

当我们有多个对话模板时,它们之间是有优先级的,在对话模板列表的上面的优先级要高于下面的,可以选中一条对话模板,然后执行上移、下移的操作来调整优先级。

这里我们定义了四个特征词:kw_to、kw_booking、kw_ticket、kw_seattype。

 
关于对话模板的更多技巧说明可 下载文档进一步学习了解:https://pan.baidu.com/s/1mjZ0W03aglsNhEHqtKo90w 密码:y0lw
 
关于训练数据中的对话样本、问答集 该如何使用可学习《UNIT2.0入门教程》--https://ai.baidu.com/forum/topic/show/869808 中的【4.4   添加训练数据】章节。
 
在使用的过程中如果遇到问题或有好的建议 可以在此帖下留言交流。遇到紧急问题也可以加入UNIT 百度Hi群:1617262 或 QQ群584835350联系技术支持协助解决。
 
收藏
点赞
0
个赞
共4条回复 最后由ybs823050666编辑于2018-07-10 22:01
#2伊茨米可回复于2018-03-13

干货!

0
#3rose20135188回复于2018-03-27

今天通过2.0,正好跟着重新学习一遍。

0
#4想你们enjoy回复于2018-05-31

加不了QQ群呀?

0
#5ybs823050666回复于2018-06-01

QQ群 无法加入。

0
TOP
切换版块