资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

语音合成SDK

Android SDK快速集成指南

只需四步,1小时内即可完成离线语音合成SDK的应用集成,让您的应用获得稳定一致的合成体验。 265AAF5E7F604B4B8C3659D26A1A86B5.jpg

Step1:成为百度AI开放平台的开发者

要调用百度AI开放平台的语音合成能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者,并新建一个百度语音合成应用。

1. 创建帐户

点击此处注册百度账户,快速建立一个百度账号,请参考下图: 屏幕截图 2021-12-29 144649.png

2. 创建应用

创建账号之后,登录百度AI开放平台,并且点击此处创建一个应用,如下图:

2BEC61B20EA249E3BAED18FF3332332E.png

创建应用时请务必输入应用名称、语音包名等信息,创建完成后就可以看到创建的应用信息了:

467E565916B34AD59FBF6C94E6CF92DF.png

创建完成的应用信息如下图所示:

54BE3792DF214677812656570322EFDF.png

Step2:申请离线合成SDK测试序列号

1. 实名认证

离线合成SDK需要完成实名认证后才能使用,第一步需要按照提示完成个人认证或企业认证。完成个人认证的用户将会获得2个测试序列号,完成企业认证的用户将会获得5个测试序列号。如下图所示进行实名认证:

0E6DDE817FC14FB296AD0BD6228AF630.png

2. 确定要集成离线合成SDK的APP应用

完成实名认证后,确认需要集成离线合成SDK的应用信息,包括APPID、应用包名、应用平台等信息。如您尚未创建语音合成应用,可点击右侧的创建应用新建一个语音合成应用,如下图所示:

EDC271F60C1C4FA4B293DA1180AEB87C.png

应用创建可参考Step1的教程,创建完成后可以在应用名称的下拉列表框看到您创建过的应用,确认您创建应用的APPID、应用包名、应用平台信息。确认信息无误后,点击确定,生成测试序列号:

902328778F3A4EB69A21F8102DB738B3.png

3. 下载测试序列号

完成离线SDK申请后,即跳转到离线合成SDK管理界面,如下图所示,可以看到已经授权的应用信息。

80142DE21B2646F5897873AD4D99A564.png

点击查看详情,可看到当前授权的有效期及包含的发音人资源情况,如下图所示:

6060E25096FD4916BD0DD68B27E7B091.png

点击下载序列号列表,即可获得测试序列号的表格文档,打开文档后即可获取到测试序列号:

3C7DC153008745E0973F1BFEA556AE94.png

Step3:填写授权信息,联网获取License

1. 获取鉴权信息

Android版离线合成SDK需要5个授权信息全部正确,才能联网拉取License,正常使用全部合成功能。 AppID、API Key、Secret Key、包名信息需要您登陆控制台查看应用详情获取,SN即为Step2中您获取到的测试序列号。

2. 不修改SDK,直接运行

解压sdk文件,不做任何修改,直接安装运行程序可以看到以下界面: B16D3E3D4AA44582B88D522FE84AEA38.jpg

3. 填写全部五个鉴权信息

填入上述5个鉴权信息测试,请按照以下步骤全部修改:

1、首先修改包名文件 app\build.gradle

9F792C7619B54131B7844083E32B1A8E.png

2、修改Java文件 app\src\main\assets\auth.properties

315B08B7D45F45D9A421061076C3D8FF.png

注意:两处的包名需要一致 ;如果 appKey secretKey 填写错误,在纯在线和离在线模式下无法使用,在纯离线模式虽然可以使用但是会有错误提示如下图所示:

0BAD8E6722984CAEA4B8F3B343FE3B7B.jpg

Step4: 断网测试离线合成功能

1. 按照上述文档修改完成后,安装app,首次使用需要联网,打开如下图:

DE4B0E9D3F884A09B98B6D642CDF6A47.jpg

2. 点击输入文本合成如下图:

F9F12B909C9B4DE39DD7EBFDB06C3987.jpg

出现该提示后,则可以正常断网离线使用。

3. 如果鉴权信息填写错误会出现下图的报错-102情况:

1E50A08A089440E4B86F629B05D5C00F.jpg

iOS SDK快速集成指南

只需四步,1小时内即可完成离线语音合成SDK的应用集成,让您的应用获得稳定一致的合成体验。 265AAF5E7F604B4B8C3659D26A1A86B5.jpg

Step1:成为百度AI开放平台的开发者

要调用百度AI开放平台的语音合成能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者,并新建一个百度语音合成应用。

1. 创建帐户

点击此处注册百度账户,快速建立一个百度账号,请参考下图: 屏幕截图 2021-12-29 144649.png

2. 创建应用

创建账号之后,登录百度AI开放平台,并且点击此处创建一个应用,如下图:

2BEC61B20EA249E3BAED18FF3332332E.png

创建应用时请务必输入应用名称、语音包名等信息,创建完成后就可以看到创建的应用信息了:

467E565916B34AD59FBF6C94E6CF92DF.png

创建完成的应用信息如下图所示:

54BE3792DF214677812656570322EFDF.png

Step2:申请离线合成SDK测试序列号

1. 实名认证

离线合成SDK需要完成实名认证后才能使用,第一步需要按照提示完成个人认证或企业认证。完成个人认证的用户将会获得2个测试序列号,完成企业认证的用户将会获得5个测试序列号。如下图所示进行实名认证:

0E6DDE817FC14FB296AD0BD6228AF630.png

2. 确定要集成离线合成SDK的APP应用

完成实名认证后,确认需要集成离线合成SDK的应用信息,包括APPID、应用包名、应用平台等信息。如您尚未创建语音合成应用,可点击右侧的创建应用新建一个语音合成应用,如下图所示:

EDC271F60C1C4FA4B293DA1180AEB87C.png

应用创建可参考Step1的教程,创建完成后可以在应用名称的下拉列表框看到您创建过的应用,确认您创建应用的APPID、应用包名、应用平台信息。确认信息无误后,点击确定,生成测试序列号:

902328778F3A4EB69A21F8102DB738B3.png

3. 下载测试序列号

完成离线SDK申请后,即跳转到离线合成SDK管理界面,如下图所示,可以看到已经授权的应用信息。

80142DE21B2646F5897873AD4D99A564.png

点击查看详情,可看到当前授权的有效期及包含的发音人资源情况,如下图所示:

6060E25096FD4916BD0DD68B27E7B091.png

点击下载序列号列表,即可获得测试序列号的表格文档,打开文档后即可获取到测试序列号:

3C7DC153008745E0973F1BFEA556AE94.png

Step3:填写授权信息,联网获取License

1. 下载最新版本的iOS SDK,打开Demo工程

下载地址:https://console.bce.baidu.com/ai/#/ai/speech/offline/index

74A64B1B543A4318BD97167EB659EF2C.png

在BDSClientSample\Modules\TTS\TTSViewController.mm 中填写API Key, Secret Key、AppID和SN(序列号)。AppID、API Key、Secret Key、包名信息需要您登陆控制台查看应用详情获取,SN即为Step2中您获取到的测试序列号。

5C2BF8D6FFB0465AB26BA0EC097E8CB9.png

纯离线sdk默认 TTS_MODE_ONLINE_PRI在线优先模式(见上图),如果要测试纯离线模式将TTS_MODE_ONLINE_PRI改为TTS_MODE_OFFLINE(如下图)其他模式具体参见文档

179970F75D204485A6517A3882E50F67.png

填写包名,务必与官网应用信息中显示的应用包名保持一致:

A5E01B1647254FFFB24676EBFA59A0A0.png

2. 添加发音人文件

右击 BDSClientSample\Resources\TTS 添加dat发音人文件:

D766F4CE978B44EC9BC97A6161EE0539.png

DBE2A59B41EF4D2C8E177E6F2C3DD781.png

添加完成后如下图:

190B07D6ECF842E8887C2F3430CAB640.png

3. 点击运行Demo

E4D10104B6D641FE915CC3F0CA519443.png

Step4: 断网测试离线合成功能

首次测试需要联网合成下载linence;打开Demo 如图,点击TTS Demo:

2E293D4A70E746D78A296BD992F9577F.png

输入合成文本点击Synthesize,在线合成播放女声:

6B088B32626C443EA3EE82C79A30051E.png

BB13500E5D7344E9AE7720C19A205BD2.png

成功播放后,断网测试离线合成播放,输入合成文本,点击Synthesize播放声音为离线男声:

1DB43774E6754CB39E0B270D0514A6E2.png

上一篇
语音识别SDK
下一篇
unit语音交互demo