资讯 社区 文档 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

接口说明

语音识别

接口描述

向远程服务上传整段语音进行识别

请求说明

举例:

// 识别本地文件
public void AsrData()
 {
     var data = File.ReadAllBytes("语音pcm文件地址");

     // 可选参数
     var options = new Dictionary<string, object>
     {
        {"dev_pid", 1537}
     };
     client.Timeout = 120000; // 若语音较长,建议设置更大的超时时间. ms
     var result = client.Recognize(data, "pcm", 16000, options);
     Console.Write(result);
 }

接口函数说明:

参数 类型 描述 是否必须
data byte[] 语音二进制数据, 语音文件的格式,pcm 或者 wav 或者 amr。不区分大小写
format String 语音文件的格式,pcm 或者 wav 或者 amr。不区分大小写。推荐pcm文件
rate int 采样率,16000、8000,固定值
cuid String 用户唯一标识,用来区分用户,填写机器 MAC 地址或 IMEI 码,长度为60以内
dev_pid Int 默认1537(普通话 输入法模型)。dev_pid 必须为整数类型。参数可选值见REST API文档说明
lan(已废弃) String 历史兼容参数,请使用dev_pid。如果dev_pid填写,该参数会被覆盖。语种选择,输入法模型,默认中文(zh)。 中文=zh、粤语=ct、英文=en,不区分大小写。

语音识别 返回数据参数详情

参数 类型 是否一定输出 描述
err_no int 错误码
err_msg int 错误码描述
sn int 语音数据唯一标识,系统内部产生,用于 debug
result int 识别结果数组,提供多个候选结果,无论返回多少个请取第一个

dev_pid 参数列表

dev_pid 语言 模型 是否有标点 备注
1537 普通话(纯中文识别) 语音近场识别模型 有标点 支持自定义词库
1737 英语 无标点 不支持自定义词库
1637 粤语 有标点 不支持自定义词库
1837 四川话 有标点 不支持自定义词库
1936 普通话远场 远场模型 有标点 不支持

返回样例:

// 成功返回
{
	"err_no": 0,
	"err_msg": "success.",
	"corpus_no": "15984125203285346378",
	"sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
	"result": ["北京天气"]
}

// 失败返回
{
	"err_no": 2000,
	"err_msg": "data empty.",
	"sn": null
}