资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

功能发布记录

语音识别

日期 更新内容
2021-03-18 音频文件转写接口功能优化:
音频文件转写接口返回结果增加音频总时长信息
2021-03-02 SDK功能优化:
Android SDK新增长语音参数BDS_ASR_ENABLE_LONG_SPEECH;
SDK开启长语音模式代表使用实时语音识别接口,以实际调用接口时长计费
2020-09-08 音频文件转写接口正式商用:
音频文件转写-中文、英语接口支持在控制台购买小时包及开通后付费
2020-06-02 实时语音识别接口正式商用:
实时语音识别-中文、英语接口支持在控制台购买小时包及开通后付费
2020-06-02 短语音识别-英文接口性能优化:
短语音识别-英语接口识别速度优化
2020-01-06 SDK功能优化:
SDK修改默认PID为1537

语音合成

日期 更新内容
2020-07-21 新增2个精品音库,在线合成音库总数扩充到11个,满足更多应用场景
2019-07-12 增加精品音库per接口,在线合成音库总数扩充到9个,满足更多应用场景
2018-07-14 添加 aue 参数,可以下载wav和pcm格式
2018-07-14 tex参数兼容一次urlencode, 推荐两次urlencode
2018-07-14 使用POST方式提交,合成限制2048个汉字。使用GET方式提交(不推荐),
拼接的url长度不超过1000个字符。注意:过长的文本将需要更多的请求耗时。
如果对时间敏感,请请自行按照标点切割,可以采用多次请求的方式。

呼叫中心语音

日期 更新内容
2021-03-18 音频文件转写(8k)接口功能优化:
音频文件转写(8k)接口返回结果增加音频总时长信息
2021-02-02 呼叫中心-在线合成接口正式商用:
呼叫中心-在线合成接口支持在控制台购买次数包及开通后付费
2020-09-08 音频文件转写(8k)接口正式商用:
音频文件转写(8k)接口支持在控制台购买小时包及开通后付费
2020-06-02 语音识别(8k)接口正式商用:
语音识别(8k)接口支持在控制台购买小时包及开通后付费