资讯 社区 文档 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

产品概述

概述

音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。接入步骤如下:

  • 接入步骤1-创建账号参考文档
  • 接入步骤2-创建应用:在控制台中,创建应用,勾选开通”语音技术“-”音频文件转写“能力。获取 AppID、API Key、Secret Key,并通过请求鉴权接口换取 token ,详细见接入指南
  • 接入步骤3-进行接口调用:1.创建音频转写任务,创建需要识别的音频任务,音频需有可公开访问的url,创建成功后,音频会开始进行语音转写任务,再通过查询结果接口进行结果查询。2.查询转写任务结果,查询识别结果。

Demo

Python Demo 点击下载 (文件为.zip压缩包,若无法打开时,可尝试在文件后上增加".zip“后缀)

语言及模型支持

支持中文普通话以及英语识别