语音识别对音频格式及时长有一定要求,可使用开源的音频格式转换及VAD切分工具。便于进行音频处理。拼音相似度工具可以通过比较拼音相似度,解决同音字问题。
- 音频格式转换工具工具使用文档。可将音频转为pcm、wav、采样率16000、单声道等识别引擎需要的格式。
- 开源VAD音频切分工具工具使用文档。将较长的音频通过静音检测(VAD)切分为更短的仅包含有声音的片段。
- 拼音相似度比较工具使用文档。将中文转换为拼音,并比较拼音相似度,在一组候选词中,找到读音与搜索词最为接近的词组。一定程度上解决同音词问题。