资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

EasyDL语音介绍

功能介绍

EasyDL语音,包含语音识别和声音分类两种训练能力,零代码自助训练语音识别语言模型,声音分类模型。提升业务领域专有名词识别准确率,区分不同声音类别,广泛适用于行业数据采集录入、语音指令、呼叫中心、声音类型检测等应用场景。

  • 科学评估,提供多维报告

上传业务场景音频和标注文本,系统自动评估语音识别基础模型得到基线准确率,输出字准、句准、核心词准等多维度评估结果报告

  • 上传语料,深度训练模型

选择基础模型上传业务场景相关文本训练语料即可自助训练语言模型,支持词汇、长文本等多种训练方式

  • 迭代优化,获取最佳模型

可多次上传文本数据迭代训练,每次训练后系统自动评估训练结果,训练效果精准提升,直观可视

  • 自动上线,模型专属使用

训练效果满意后,无需复杂操作,通过申请流程即可将模型上线使用,模型专属使用

特色优势

零门槛操作

一站式自动化训练,上传文件即可最快10分钟训练优化语言模型。

高精准评估

系统自动评估多种基础模型,推荐最优模型进行训练。训练前后均提供字准、句准、核心词准等多维度评估结果报告,

强训练效果

预置百度超大规模预训练模型,多个基础模型支持多行业多业务场景。支持词汇、长段文本等多种训练方式。支持多次上传训练文本,迭代训练不断优化模型,平均5%-25%识别准确率提升。

超灵活部署

模型通过申请流程即可自动上线,用户账号专属使用。支持在线API,websocket API,多种操作系统的SDK,适配多种终端的使用需求

应用场景

训练语音识别模型可以在如下的应用场景中获得更好的识别效果

  • 语音对话:APP语音助手,金融、医疗、航空公司智能机器人对话等短语音交互场景,使用领域中的专业术语进行训练,提高对话精准度
  • 语音指令:智能硬件语音控制、 app内语音搜索关键词、语音红包等场景,训练固定搭配的指令内容,让控制更精确
  • 语音录入:农业采集、工业质检、物流快递单录入、餐厅下单、电商货品清点等业务信息语音录入场景,训练业务中的常用词,录入的结果更加有效
  • 电话客服:运营商、金融、地产销售等电话客服业务场景,使用领域中的专业术语进行训练,提高对话精准度

训练声音分类模型可以在如下的应用场景中定制区分不同的声音类型

  • 安防监控:定制识别不同的异常或正常的声音,进而用于突发状况预警
  • 科学研究:定制识别同一物种的不同个体的声音、或者不同物种的声音,协助野外作业研究

快速使用

语音技术下任一接口进行付费,即可免费训练语音识别模型,不收取额外的训练费用。

上一篇
EasyDL 文本使用说明
下一篇
语音识别