开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语音技术

    集成指南

    集成指南

    强烈建议用户首先运行SDK包中的Demo工程,Demo工程中详细说明了语音合成的使用方法,并提供了完整的示例。一般情况下,您只需参照demo工程即可完成所有的集成和配置工作。

    创建应用

    请参考《百度AI开放平台使用指南》创建应用,开通服务并完成个性化设置。

    添加BDSSpeechSynthesizer到工程

    BDSSpeechSynthesizer使用了一些系统的framework,需要添加到工程里面。

    添加方式: 右键点击 Xcode 中的工程文件,在出现的界面中,选中 TARGETS 下的应用,在出现的界面中选中 Build Phases->Link Binary With Libraries,点击界面中的“+”图标,在弹出的界面中选择需要的framework即可。请参考demo工程引入所需动态库framework和静态库。

    开发者编译自己工程时,若报错 ld: Library xxxx not found,一般是库文件没有正确引入。请确保库文件在工程所能找到的位置之内(通过 LIBRARRY_SEARCH_PATH设置)

    添加语音合成相关资源文件

    将开发包中的BDSClientResource目录下的相关资源文件添加到工程或者安装app后部署到指定目录(代码中启动合成引擎时需要指定该资源文件的访问路径)。根据具体需求引入不同的资源即可。

    引入BDSSpeechSynthesizer的头文件

    首先将 BDSSpeechSynthesizer 提供的头文件拷贝到工程目录下,在 XCode 中添加此文件,引入 BDSSpeechSynthesizer提供的头文件。

    添加如下头文件:

    #import "BDSSpeechSynthesizer.h"

    引入静态库文件

    BDSSpeechSynthesizer提供了支持真机 armv7,armv7s,arm64及更新架构所使用的静态库文件,存放在开发包lib目录下。

    引入静态库文件的具体方式为:将libBaiduSpeechSDK.a 采用添加文件方式添加到工程的Framework 目录下。

    说明: libBaiduSpeechSDK.a 是一个通用的库文件,支持armv7、arm64、i386、x86_64, 避免开发者在 build 不同 target 时频繁替换.a 文件的问题

    配置鉴权参数

    离在线语音合成模式

    请从官网控制台复制您的App密钥,设置APP_ID、API_KEY、SECRET_KEY参数。并绑定你的移动应用的BundleId。分别加载在线和离线引擎。

    纯离线语音合成模式

    请参考configureOfflineTTS方法配置离线资源文件和鉴权。 调用

    [[BDSSpeechSynthesizer sharedInstance] loadOfflineEngine:offlineTextData speechDataPath:offlineSpeechData licenseFilePath:**nil** withAppCode:APP_ID withSn:SN];

    加载离线引擎。

    资源文件包括『Speech文件』和『Text文件』,音库名称对应如下

    SDK默认自带离线资源文件

    资源文件 具体文件名
    m15 离线男声(度小宇) bd_etts_common_speech_m15_mand_eng_high_am-mgc_v3.6.0_20190117.dat
    离线模型 bd_etts_common_text_txt_all_mand_eng_middle_big_v3.4.2_20190710.dat

    需要单独下载的精品音库资源文件

    资源文件 具体文件名
    f7 离线女声(度小美) bd_etts_common_speech_f7_mand_eng_high_am-mgc_v3.6.0_20190117.dat
    yyjw 离线度逍遥 bd_etts_common_speech_yyjw_mand_eng_high_am-mgc_v3.6.0_20190117.dat
    as 离线度丫丫 bd_etts_common_speech_as_mand_eng_high_am-mgc_v3.6.0_20190117.dat
    cp 离线度小娇 bd_etts_common_speech_cp_mand_eng_high_am-sp_v3.6.0_20190612
    miduo 离线度米朵 bd_etts_common_speech_miduo_mand_eng_high_am-sp_v3.6.0_20190612
    wyg 离线度博文 bd_etts_common_speech_wyg_mand_eng_high_am-sp_v3.6.0_20190612
    c4 离线度小童 bd_etts_common_speech_c4_mand_eng_high_am-sp_v3.6.0_20190722
    f8 离线度小萌 bd_etts_common_speech_f8_mand_eng_high_am-sp_v3.6.0_20190722
    f12 度小乔 bd_etts_common_speech_f12_mand_eng_high_am-emph24k_v3.6.0_20191108.dat
    f17 度小鹿 bd_etts_common_speech_f17_mand_eng_high_am-emph24k_v3.6.0_20191108.dat
    fduxiaotai 度小台 bd_etts_common_speech_fduxiaotai_mand_eng_high_am-emph16k_v3.6.0_20191108.dat
    粤语离线模型 bd_etts_common_text_txt_all_cant_eng_middle_mix_v3.1.0_20170914.dat
    ctf-std 度小粤 bd_etts_common_speech_ctf-std_cant_eng_high_am-mgc_v3.6.0_20191108.dat
    英文离线模型 bd_etts_eng_common_text_all_v2.2.0_middle__20161116.dat
    fnat 度小译 bd_etts_common_speech_fnat_eng_high_am-emph24k_v3.6.0_20191105.dat

    中文、粤语、英文因为使用不同的Text文件,之间通过reinitOfflineEngineData 无法完成切换。必须反初始化,在初始化。 离线SN和资源文件请联系我们提供。

    上一篇
    简介
    下一篇
    重要接口说明