开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语音技术

    输入参数

    语音识别

    预定义命令

    语音识别目前支持的命令如下:

    命令 功能描述
    BDS_ASR_CMD_START 启动识别
    BDS_ASR_CMD_STOP 结束语音输入,等待识别完成
    BDS_ASR_CMD_CANCEL 取消本次识别
    BDS_ASR_CMD_LOAD_ENGINE 加载离线引擎,如使用离线识别,在启动识别前需调用此命令
    BDS_ASR_CMD_UNLOAD_ENGINE 卸载离线引擎,如改变离线配置参数,需重新加载离线引擎

    参数说明

    通过配置不同的参数,语音识别提供丰富的功能,说明如下:

    在线引擎身份验证

    参数名称 说明
    BDS_ASR_API_SECRET_KEYS 开放平台设置API_KEY and SECRET_KEY
    BDS_ASR_PRODUCT_ID 内部产品设置产品ID

    离线引擎身份验证

    参数名称 说明
    BDS_ASR_OFFLINE_LICENSE_FILE_PATH 离线授权文件路径
    BDS_ASR_OFFLINE_APP_CODE 离线授权所需APPCODE(APPID),
    如使用该方式进行正式授权,请移除临时授权文件

    识别器参数配置

    参数名称 说明
    BDS_ASR_SAMPLE_RATE 设置录音采样率,自动模式根据当前网络情况自行调整
    BDS_ASR_STRATEGY 语音识别策略
    BDS_ASR_LANGUAGE 设置识别语言
    BDS_ASR_ENABLE_NLU 开启语义解析,将返回包含语义的json串
    BDS_ASR_DISABLE_PUNCTUATION 关闭输出标点
    BDS_ASR_PUNCTUATION_EXT_MOD 扩展标点模式,使用请确保BDS_ASR_DISABLE_PUNCTUATION参数为NO
    BDS_ASR_ENABLE_LOCAL_VAD 是否需要对录音数据进行端点检测,如果关闭,请同时关闭服务端提前返回
    BDS_ASR_ENABLE_EARLY_RETURN 服务端开启提前返回,即允许服务端在未收到客户端发送的结束标志前提前结束识别过程
    BDS_ASR_ENABLE_MODEL_VAD 是否使用ModelVAD,打开需配置资源文件参数
    BDS_ASR_MODEL_VAD_DAT_FILE ModelVAD所需资源文件路径
    BDS_ASR_VAD_ENABLE_LONG_PRESS 设置VAD模式为长按(特殊情况设置)
    BDS_ASR_MFE_DNN_DAT_FILE 设置MFE模型文件
    BDS_ASR_MFE_CMVN_DAT_FILE 设置MFE CMVN文件路径
    BDS_ASR_MFE_MAX_WAIT_DURATION 设置DNNMFE最大等待语音时间
    BDS_ASR_MFE_MAX_SPEECH_PAUSE 设置DNNMFE切分门限
    BDS_ASR_ENABLE_LONG_SPEECH 是否启用长语音识别

    音频相关

    参数名称 说明
    BDS_ASR_AUDIO_FILE_PATH 设置音频文件路径(数据源)
    BDS_ASR_AUDIO_INPUT_STREAM 设置音频输入流(数据源)
    BDS_ASR_PLAY_TONE 识别提示音设置,需添加相应声音文件,可替换
    BDS_ASR_DISABLE_AUDIO_OPERATION 屏蔽SDK内部设置AudioSession的Active状态

    日志级别

    参数名称 说明
    BDS_ASR_DEBUG_LOG_LEVEL 指定调试日志级别

    离线识别相关

    参数名称 说明
    BDS_ASR_OFFLINE_ENGINE_TYPE 离线识别引擎类型
    BDS_ASR_OFFLINE_ENGINE_DAT_FILE_PATH 离线识别资源文件路径
    BDS_ASR_OFFLINE_ENGINE_GRAMMER_FILE_PATH 离线识别语法文件路径
    BDS_ASR_OFFLINE_ENGINE_GRAMMER_SLOT 语法模式离线语法槽,使用该参数更新离线语法文件

    唤醒后立刻识别相关

    参数名称 说明
    BDS_ASR_OFFLINE_ENGINE_WAKEUP_WORDS_FILE_PATH 唤醒词文件路径,使用了唤醒并使用离线语法识别的情况下需要设置,其他情况请忽略该参数
    BDS_ASR_OFFLINE_ENGINE_TRIGGERED_WAKEUP_WORD 当前触发唤醒词,唤醒后立即调用识别的情况下配置,其他情况请忽略该参数
    BDS_ASR_NEED_CACHE_AUDIO 唤醒后立刻进行识别需开启该参数,其他情况请忽略该参数

    服务端配置相关

    参数名称 说明
    BDS_ASR_SERVER_URL 设置服务器地址
    BDS_ASR_BROWSER_USER_AGENT 设置浏览器标识(Http request header),资源返回时会根据UA适配

    语音唤醒

    预定义命令

    语音唤醒目前支持的命令如下:

    命令 功能描述
    BDS_WP_CMD_START 启动唤醒
    BDS_WP_CMD_STOP 关闭唤醒,释放内存需调用卸载命令
    BDS_WP_CMD_LOAD_ENGINE 加载唤醒引擎
    BDS_WP_CMD_UNLOAD_ENGINE 卸载唤醒引擎,如改变了引擎参数,请重新加载

    参数说明

    为使唤醒引擎正常工作,开发者需了解以下参数:

    基本配置

    参数名称 说明
    BDS_WAKEUP_WORDS_FILE_PATH 唤醒词文件路径,从开放平台获取该文件
    BDS_WAKEUP_DAT_FILE_PATH 唤醒引擎模型文件路径
    BDS_WAKEUP_APP_CODE 离线正式授权所需APPCODE,即APPID
    BDS_WAKEUP_LICENSE_FILE_PATH 离线授权文件路径,正式授权需移除该文件
    BDS_WAKEUP_WORK_QUEUE 指定SDK工作队列

    音频相关

    音频相关的参数与识别引擎共享,如同时使用,只需配置一次

    参数名称 说明
    BDS_WAKEUP_AUDIO_FILE_PATH 设置音频文件路径(数据源)
    BDS_WAKEUP_AUDIO_INPUT_STREAM 设置音频输入流(数据源)
    BDS_WAKEUP_DISABLE_AUDIO_OPERATION 屏蔽SDK内部设置AudioSession的Active状态
    上一篇
    调用流程
    下一篇
    输出参数