开放能力
开发平台
行业应用
生态合作
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
场景方案
部署方案
行业应用
智能工业
智能零售
企业服务
智能政务
智能教育
智能农业
信息服务
智能园区
智能硬件
AI公众号
关注AI公众号
获取AI资讯,体验AI能力
长语音识别
通过SDK调用服务,可将长语音(长时间连续说话)转换为文字
功能介绍
提供业界优质的长语音识别服务,在会议、教学或者媒体采访中,百度长语音识别服务可快速准确的将长时间的语音转化为文字,方便进行拷贝和编辑等后续的工作,让您的工作、生活变得更便捷
应用场景
会议记录
将会议上的音频转换为文字信息,方便后期的文字处理和内容存档,省去会议记录的人力和时间成本
实时字幕
将直播、视频、现场演讲等音频进行实时的字幕转换,降低理解成本,提升用户体验
语音笔记
可将笔记、总结等,通过语音的方式转为文字,进行记录,大幅提升了用户的录入效率
技术特色
自定义上传识别词库
开发者可以自行上传词库,训练专属识别模型,提交的语料越多、越全,语音识别的效果提升也会越明显
深度语义解析
支持多达35个垂类领域的语义理解,如:交通,社交,娱乐等领域。还可支持自定义指令集和问答对的设置