开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语音技术

    创建音频转写任务

    创建音频转写任务

    接口描述:根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务

    请求接口:https://aip.baidubce.com/rpc/2.0/aasr/v1/create

    HTTP 方法:POST

    URL参数:

    参数 取值
    access_token 通过 API Key 和 Secret Key 获取的 access_token,参考Access Token获取

    Body中放置请求参数,参数如下:

    参数名 类型 是否必需 对外状态 取值范围
    speech_url str 音频url 可使用百度云对象存储进行音频存储,生成云端可外网访问的url链接,音频大小不超过500MB
    format str 音频格式 ["mp3", "wav", "pcm","m4a","amr"]单声道,编码 16bits 位深
    pid int 语言类型 [80001(中文语音近场识别模型极速版), 1737(英文模型)]
    rate int 采样率 [16000] 固定值

    若音频采样率为8k,请使用呼叫中心音频文件转写

    Body请求示例:

    {
        "speech_url": "https://platform.bj.bcebos.com/sdk%2Fasr%2Fasr_doc%2Fdoc_download_files%2F16k.pcm",
        "format": "pcm",
        "pid": 80001,
        "rate": 16000
    }

    返回参数

    参数名 类型 是否必需 对外状态
    log_id int log id
    task_id str 任务id
    task_status str 任务状态
    error_code int 错误码
    error_msg str 错误信息

    Body返回示例:

    # 创建成功
    {
        "log_id": 12345678,
        "task_status": "Created",
        "task_id":  "234acb234acb234acb234acb"  #注意保存该id,用于后续请求识别结果
    }
    # 创建失败,缺少参数
    {
        "error_code": 336203,
        "error_msg": "missing param: speech_url",
        "log_id": 5414433131138366128
    }

    注意:查询识别结果时,需要该步骤返回的task_id来进行请求。请注意保存task_id列表。

    上一篇
    产品概述
    下一篇
    查询音频转写任务结果