AI加速器
AI市场
资讯
社区
语音技术不限量免费 助力开启语音交互时代
发布日期:2018-06-08 11:55:36浏览量:2694次

百度语音技术,提供国际领先的语音识别、语音合成技术,帮助各行业实现语音和文本之间的相互转换免费额度再升级,赋能开发者,开启语音交互新时代。

 

【无限次免费调用】

语音识别:原免费调用量5万次/天,现升级为无限次免费调用,默认每个应用10QPS并发;

语音合成:免费调用量20万次/天,现升级为无限次免费调用,默认每个应用100QPS并发。

您若有高并发业务(识别>10QPS,合成>100QPS)需求,可在控制台—>应用列表—>应用详情页,提交申请。

老用户的QPS,已根据历史使用情况进行了自动配置,可放心使用,可在控制台对应的应用详情页查看。

 

【百度语音技术简介】

语音识别

  • 多语言:普通话、四川话、粤语、英语
  • 支持长语音识别:不限时长
  • 支持远场语音识别
  • 自定义词库:提高专有场景/专有名词识别率
  • 离线命令词:断网时可识别常用词/

 

语音合成

  • 多发音人:普通男/女声,情感发音人(软萌、武侠气质音色可选)
  • 音量、音调、语速可调,获得个性化声音体验
  • 多音字可标注,灵活满足业务需求
  • 支持离在线合成,断网时也可继续使用

 

【应用场景】

泛阅读

  • 有声朗读:新闻、小说等内容以语音的形式播放给用户;
  • 语音指令:通过语音控制翻页、内容查询等操作。

 

视频直播

  • 语音质检:将主播或视频中的音频进行识别后,对文字进行内容审核;
  • 实时字幕:将视频中的语音实时地转为文字,生成字幕;
  • 合成配音:将视频的旁白通过语音合成,制作配音。

 

游戏

  • 语音播报:NPC、剧情等内容通过语音进行播报;
  • 语音控制:语音操纵游戏角色动作行为;
  • 语音交流:可将聊天终端文字和语音相互转换,提供更流畅的游戏体验。

 

交通出行

  • 语音下单:通过语音完成下单操作,提升操作体验与业务效率;
  • 订单播报:在新增或完成订单时,通过语音播放方式将订单信息及时同步服务人员;
  • 语音导航:通过语音搜索目的地,在行驶过程中用语音向用户提示形式线路。

 

智能硬件

  • 语音交互:通过语音搜索问题,并用语音播报结果;
  • 语音操控设备:识别语音指令,操纵设备。

 

搜索输入

  • 语音搜索:通过语音命令快速发起搜索,让搜索更快捷、更智能;
  • 语音输入:通过语音代替文字输入、提升输入功率。

 

除了通用的语音识别外,我们还提供了呼叫中心的相关语音技术,点击了解详情。

更多应用场景,等待您的开发。近期,我们还将推出更多的语音技术,敬请期待。

如果您有其它疑问或需求,可点击屏幕右下角标志,提交具体咨询信息。