资讯 社区 文档 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

产品概述

产品简介

长文本在线合成接口可以将10万字以内文本一次性合成,异步返回音频。支持多种优质音库,将超长文本快速转换成稳定流畅、饱满真实的音频。适用于阅读听书、新闻播报等客户。

应用场景

阅读听书:万字小说一次性合成,可反复播放,给用户带来更流畅、更稳定的听书体验

新闻播报:长篇稿件批量快速合成,释放播音员人力,保障新闻生产时效性

产品优势

  • 一次性合成:支持一次性合成10万字,无需拆分文本和拼接音频,并支持下载到本地,大幅节省开发成本
  • 优质音库:为您提供极致拟人、情感饱满的语音合成效果
  • 合成速度快:5万字最快仅需5分钟,合成速度业界领先水平

产品功能

  1. 支持中文普通话、简单中英文混读
  2. 支持 mp3-16k、mp3-48k、wav、pcm-8k、pcm-16k 等多种音频格式和采样率
  3. 支持自定义语速、语调、音量调节
  4. 支持多音字标注发音,格式如:重(chong2)报集团。
  5. 支持文本分段,段落间增加1s停顿
  6. 支持主动查询、自动回调两种方式获取结果

Demo

Python Demo 点击下载 (文件为.zip压缩包,若无法打开时,可尝试在文件后上增加".zip"后缀)