关于词槽词典的问题
szsheep 发布于2019-11 浏览:1019 回复:1
0
收藏

最近希望可以让手机可以自动切换会话,所以希望有如下场景的:

 

如: 切换到XXXXXX群, 我把这种场景拆分成 [D:kw_switch][D:user_session],就是一个特征词,一个词槽。

目前的我词槽用的字典只有一个,就是$$$[\u4e00-\u9fff]{1,32}, 希望可以匹配从1到32个字的汉字字串(先不考虑英文和数字)。

我设定的对话模板,把特征词和词槽分开了模板片段,均包含。阈值设为0.6。但每次训练后,我输入: 切换XXXXXX群,

很多时候给我返回的词槽直接是整句话,感觉完全忽略我的特征词的匹配。我想问问,向我这种情况,我后面的群名字的词槽,

我要如何设定?因为这些词均不可预知具体格式或名字,必须用通用化的匹配方式。但如果这样,为什么系统默认的把特征词也

当成部分词槽的值?

 

如果是你们,像类似这种: 切换XXXXXX群,你们应该怎么来拆解?

 

谢谢

收藏
点赞
0
个赞
共1条回复 最后由半醉半醒半疯Z回复于2019-11
#2半醉半醒半疯Z回复于2019-11

可以考虑正则的子表达式的形式去识别,对需要识别的内容进行一些限定,这样才不容易出现识别太宽泛的情况。

正则文档:http://ai.baidu.com/forum/topic/show/492687

0
TOP
切换版块