开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语音技术

    简介

    简介

    本文档是百度在线语音合成iOS SDK的用户指南,描述了语音合成相关接口的使用说明。

    在线合成SDK下载

    概念解释

    语音合成是实现人机语音交互,建立一个有听和讲能力的交互系统所必需的关键技术。随着语音技术的发展,百度自主研发了语音合成系统(TTS),功能是接收用户发送的文本,生成语音发送给用户。

    对本文中将提到的名词约定如下:

    语音合成(Text To Speech,TTS):将文本合成为语音,即声音文件。

    合成引擎:将文本合成为语音的核心模块。

    百度语音合成SDK(BDSSpeechSynthesizer):本开发包。BDSSpeechSynthesizer是一个封装了网络首发、音频播放功能的语音合成解决方案。借助BDSSpeechSynthesizer可以在应用程序中快速集成语音合成功能。

    功能介绍

    百度语音合成客户端iOS在线版SDK(以下简称BDSSpeechSynthesizer)是一种面向iOS移动设备的语音合成解决方案,以Cocoa Touch Static Library形式发布。

    本SDK仅支持在线语音合成,如需离线合成功能,请使用纯离线合成SDK。支持语速、音调、音量、引擎优化级别、发音人、男女声等合成参数设置。

    本版使用在线语音合成服务合成,以获得更好的合成效果。如在线合成服务不可用,如网络连接异常,蜂窝信号差等,将会导致合成失败。

    兼容性

    • 系统: 支持iOS 8.0及以上。
    • 机型: iPhone和iPad皆可。
    • 架构: 支持i386、x86_64、armv7、arm64。 (离线合成不支持i386和x86_64架构。)

    资源占用描述

    静态库占用:

    SDK类型 二进制增量 __TEXT增量
    合成 9.3M 4.0M~4.6M

    SDK大小说明

    1. 由于 BITCODE 开启会导致二进制文件体积增大,这部分会在 APPStore 发布时进行进一步编译优化,并不会引起最终文件的体积变化,故此处计算的是关闭 BITCODE 下的二进制增量。
    2. .a中是多个架构做了合并,使用lipo可以看到细节。所以.a库文件本身很大,且打包出来的ipa也相对较大。但用户实际下载到手机中会被AppStore优化,只下载用户设备需要的架构,所以实际在手机上占用的空间很小。
    Architectures in the fat file: libBaiduSpeechSDK.a are: armv7 i386 x86_64 arm64

    以下是2.2.9.0在iPhone5s中安装Demo后,实际系统计算出的App占用大小,根据机型可能会有差异。

    功能 大小
    在线合成,不引入离线合成资源 7M

    开发包说明

    文件(夹)名 说明 备注
    BDSClientLib 在线语音合成SDK Lib库,支持simulator和iOS设备。 必须引入
    BDSClientSample 开发示例(xcode project)
    上一篇
    在线合成Android-SDK
    下一篇
    集成指南