产品服务
语音技术
图像技术
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
硬件产品与服务
定制化训练平台
深度学习开放平台
硬件产品
官方认证的硬件产品与百度AI协同应用
百度推出的软硬一体化服务机器人
硬件与软件开源的机器人视觉产品方案
软硬一体化的人脸识别开发套件
软硬一体化的远场语音开发套件
硬件赋能
快速赋能移动设备及智能手机
实现自建模型端计算SDK的自动生成
高性能计算卡参考方案&软件工具包
EdgeCloud端云协同平台
为抓拍机厂商提供端云对接协议及产品推广
可视化配置,实现抓拍机管理与业务系统集成
硬件合作
开放评测认证让您的产品加入AI生态
开放与芯片合作,让AI深度走入终端设备
可视化训练模型服务平台,获取高精度定制图像识别、声音识别、文本分类服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
自助训练专属模型,提升业务场景语音识别效果
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
源于产业实践的开源深度学习平台
零代码生成高性能端计算模型
基于真实样本的超大规模的开放数据集
AI加速器
AI市场
资讯
社区
爱奇艺
爱奇艺,中国视频行业领先者。秉承“悦享品质”的品牌口号,为用户提供丰富、高清、流畅的专业视频体验,让人们平等、便捷地获得更多、更好的视频。
使用产品
支持与交流
语音识别助爱奇艺优化搜索体验
价值成果
1、百度语音识别准确率高达97%以上,线上识别响应在百毫秒级别,运行流畅稳定;当SDK升级或保障时,有专人负责团队跟进。
2、每天有超过200万次的请求访问百度语音识别服务,新增5万语音来源播放次数,人均播放时长35分钟;语音唤醒游戏下载1万余次,新增2000余次的安装转化; 语音识别服务是最基础的对话体验,为爱奇艺用户使用语音功能保驾护航。
案例故事
核心诉求
随着越来越多人习惯使用语音输入,语音与文字一样变得不可或缺。通过爱奇艺语音搜索关键词分析发现,用户具有高频次、低龄化、分地域的属性特征,为了更好的满足不同层次的语音用户搜索需求,播放下载视频智能化,需要为爱奇艺用户提供一套不同场景下精确的语音识别服务。
解决方案
百度语音识别解决方案:通过访问用户麦克风,收集用户语音数据、上传至服务器,识别服务分析,转译成文字等技术能力,完成字符串输出,提供爱奇艺使用。而ASR技术解决方案的关键技术难点,在于解决噪音、多人同时说话、远景识别、回声处理等。

现在,解决了爱奇艺语音搜索场景下的痛点:

去噪:在繁杂的环境下能较好地去除噪声。
性能:在用户搜索交互过程中实现了流式处理,边说边译。
鲁棒性:对于不同口音的用户输入,能够实现精准的识别。
具体实现过程如下图: