产品服务
语音技术
图像技术
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
软硬一体产品
专项解决方案
定制化训练平台
深度学习开放平台
内置离线识别SDK,5分钟快速搭建人脸识别业务应用
硬件开源,软件开放,为机器人打造软硬一体的视觉方案
看得准、听得懂、说得明、交互好的一体化服务机器人
快速完成用户身份核实,确保真人且为本人
在复杂环境下自动识别特定人员及异常行为
针对准入场景,提供行业定制的全流程方案
辅助坐席人员实时了解客户意图,推荐话术应答
参会人邀请注册、刷脸签到、与会人统计管理平台
提供自研的数据仓库、日志分析、数据挖掘等方案
人脸注册、人脸捕获、会员识别整套解决方案
可视化训练模型服务平台,获取高精度的定制图像识别服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
最符合中国开发者需要的深度学习框架
基于真实样本的超大规模的开放数据集
AI加速器
AI市场
资讯
社区
语音技术不限量免费 助力开启语音交互时代
发布日期:2018-06-08 11:55:36浏览量:4716次

百度语音技术,提供国际领先的语音识别、语音合成技术,帮助各行业实现语音和文本之间的相互转换免费额度再升级,赋能开发者,开启语音交互新时代。

 

【无限次免费调用】

语音识别:原免费调用量5万次/天,现升级为无限次免费调用,默认每个应用10QPS并发;

语音合成:免费调用量20万次/天,现升级为无限次免费调用,默认每个应用100QPS并发。

您若有高并发业务(识别>10QPS,合成>100QPS)需求,可在控制台—>应用列表—>应用详情页,提交申请。

老用户的QPS,已根据历史使用情况进行了自动配置,可放心使用,可在控制台对应的应用详情页查看。

 

【百度语音技术简介】

语音识别

  • 多语言:普通话、四川话、粤语、英语
  • 支持长语音识别:不限时长
  • 支持远场语音识别
  • 自定义词库:提高专有场景/专有名词识别率
  • 离线命令词:断网时可识别常用词/

 

语音合成

  • 多发音人:普通男/女声,情感发音人(软萌、武侠气质音色可选)
  • 音量、音调、语速可调,获得个性化声音体验
  • 多音字可标注,灵活满足业务需求
  • 支持离在线合成,断网时也可继续使用

 

【应用场景】

泛阅读

  • 有声朗读:新闻、小说等内容以语音的形式播放给用户;
  • 语音指令:通过语音控制翻页、内容查询等操作。

 

视频直播

  • 语音质检:将主播或视频中的音频进行识别后,对文字进行内容审核;
  • 实时字幕:将视频中的语音实时地转为文字,生成字幕;
  • 合成配音:将视频的旁白通过语音合成,制作配音。

 

游戏

  • 语音播报:NPC、剧情等内容通过语音进行播报;
  • 语音控制:语音操纵游戏角色动作行为;
  • 语音交流:可将聊天终端文字和语音相互转换,提供更流畅的游戏体验。

 

交通出行

  • 语音下单:通过语音完成下单操作,提升操作体验与业务效率;
  • 订单播报:在新增或完成订单时,通过语音播放方式将订单信息及时同步服务人员;
  • 语音导航:通过语音搜索目的地,在行驶过程中用语音向用户提示形式线路。

 

智能硬件

  • 语音交互:通过语音搜索问题,并用语音播报结果;
  • 语音操控设备:识别语音指令,操纵设备。

 

搜索输入

  • 语音搜索:通过语音命令快速发起搜索,让搜索更快捷、更智能;
  • 语音输入:通过语音代替文字输入、提升输入功率。

 

除了通用的语音识别外,我们还提供了呼叫中心的相关语音技术,点击了解详情。

更多应用场景,等待您的开发。近期,我们还将推出更多的语音技术,敬请期待。

如果您有其它疑问或需求,可点击屏幕右下角标志,提交具体咨询信息。