资讯 社区 文档 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

开发工具

语音识别对音频格式及时长有一定要求,可使用开源的音频格式转换及VAD切分工具。便于进行音频处理。拼音相似度工具可以通过比较拼音相似度,解决同音字问题。

  • 音频格式转换工具工具使用文档。可将音频转为pcm、wav、采样率16000、单声道等识别引擎需要的格式。
  • 开源VAD音频切分工具工具使用文档。将较长的音频通过静音检测(VAD)切分为更短的仅包含有声音的片段。
  • 拼音相似度比较工具使用文档。将中文转换为拼音,并比较拼音相似度,在一组候选词中,找到读音与搜索词最为接近的词组。一定程度上解决同音词问题。