在线识别识别离线词表不正确
fangzhengshu 发布于2018-04 浏览:5155 回复:2
0
收藏
语音识别功能:
使用SLOT_DATA替换本地词库:“黄清峰”"黄彬"
使用在线识别功能很难识别对,都是识别成“黄青峰”“黄冰”等
离线功能识别正常
如果不想上传本地词表到服务器,应该如何解决上述问题?
收藏
点赞
0
个赞
共2条回复 最后由q17821959241回复于2022-08
#3周俊316回复于2018-04

您再测试下

0
#2周俊316回复于2018-04

可以自定义识别词,提升准确率。

仅在搜索模型下生效。

自定义词库适合短句,保证词库中一模一样的短句可以被识别出,词库中的分词优先级较高。 自定义词库仅对dev_pid = 1536生效。 举例 词库定义了1个短句: 1 . 摆渡船来了 百度内部处理的可能的分词结果: 摆渡船 来 了

以下录音的结果

原始音频:摆渡船来了 =》识别结果: 摆渡船来了 【保证结果】
原始音频:摆渡船来了么 =》识别结果: 百度传来了么 【可能结果,不保证】
原始音频:摆渡船来 =》 识别结果: 百度传来 【可能结果,不保证】
原始音频:百度传来了喜讯 =》 识别结果: 摆渡船传来了喜讯 , 【不保证,词库内的分词优先级高】
最好在1万行以内。

副作用:如果用户的测试集中包含大量非自定义词表的query,整体上准确率下降。

0
TOP
切换版块