开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

产品概述

产品简介

长文本在线合成接口可以将10万字以内文本一次性合成,异步返回音频。支持多种优质音库,将超长文本快速转换成稳定流畅、饱满真实的音频。适用于阅读听书、新闻播报等客户。

应用场景

阅读听书:万字小说一次性合成,可反复播放,给用户带来更流畅、更稳定的听书体验

新闻播报:长篇稿件批量快速合成,释放播音员人力,保障新闻生产时效性

产品优势

  • 一次性合成:支持一次性合成10万字,无需拆分文本和拼接音频,并支持下载到本地,大幅节省开发文本
  • 优质音库:为您提供极致拟人、情感饱满的语音合成效果
  • 合成速度快:5万字最快仅需5分钟,合成速度业界领先水平

产品功能

  1. 支持中文普通话、简单中英文混读
  2. 支持 mp3-16k、mp3-48k、wav、pcm-8k、pcm-16k 等多种音频格式和采样率
  3. 支持自定义语速、语调、音量调节
  4. 支持多音字标注发音,格式如:重(chong2)报集团。
  5. 支持文本分段,段落间增加1s停顿
  6. 支持主动查询、自动回调两种方式获取结果

Demo

Python Demo 点击下载 (文件为.zip压缩包,若无法打开时,可尝试在文件后上增加".zip"后缀)

上一篇
离线语音合成
下一篇
创建任务