通用词槽的识别问题
pingchen1973 发布于2018-12 浏览:1235 回复:2
0
收藏

我在做一个语音查询邮件的功能。典型查询语句是:“我想查一下[成龙] [昨天到今天] 发给我的 [关于] [电影] 的邮件”。“电影”这个词槽内容很广泛,算是通用的词汇,想了很多办法,unit总是不识别这个词槽。不知道是不是unit不适合设别这种没范围的通用词槽?

收藏
点赞
0
个赞
共2条回复 最后由pingchen1973回复于2018-12
#3pingchen1973回复于2018-12

其实电影只是一个例子。我是希望查关于xxx的邮件。这个xxx没有明确的范围。训练不出来啊。

0
#2goJhou回复于2018-12

你是要具体的电影名称库吗。系统词槽提供一个sys_video的库其中有一个sys_video_movie是电影类的,你可以使用一下。

 

不知道系统词槽会不会随时更新,但我估计是不会的,因为院线更新意味着模型重新训练,每一个模型估计数据集是不可变的。

我建议你把这个词槽可以设计在业务层,自己维护一个电影词典,然后通过模板的方式去抽取,指定给UNIT填充词槽

0
TOP
切换版块