请问怎么定制更细的分词?
jiangsir1216 发布于2018-07-23 浏览:751 回复:3
0
收藏

请问怎么把词分得再细一些, 比如"太冷了" ,现在是分为 "太冷" 和 "了" , 想要分为 "太" "冷" "了", 要怎么设置呢?

收藏
点赞
0
个赞
共3条回复 最后由choleraa回复于2018-07-25
#4choleraa回复于2018-07-25
#3 jiangsir1216回复
我们是做中文教学的, 很多词需要比现在的分词结果要更细,但不一定都是一个字一个字的
展开

用定制化分词是可以的做的. 但我不是很确定能否实现你所说的粒度. 只能试试看了.

0
#3jiangsir1216回复于2018-07-25
#2 choleraa回复
你这个例子有点怪怪的, 你要是想把"中华人民共和国"切成"中华""人民""共和国", 就把这三个词放到定制化词表就可以了. 但是你说拆成一个字一个字的, 那建议写个数组, 逐字存储.
展开

我们是做中文教学的, 很多词需要比现在的分词结果要更细,但不一定都是一个字一个字的

0
#2choleraa回复于2018-07-25

你这个例子有点怪怪的, 你要是想把"中华人民共和国"切成"中华""人民""共和国", 就把这三个词放到定制化词表就可以了. 但是你说拆成一个字一个字的, 那建议写个数组, 逐字存储.

0
TOP
切换版块