语音合成
更新时间:2020-06-28
语音合成
如需使用语音合成能力,则需在下载的Mrcp Server中对合成配置文件进行参数更改 {SERVER_ROOT}/mrcp-server/conf/mrcp-proxy.conf
。确保AUTH_APPID和AUTH_APPKEY填写正确。
- AUDIO_CONTROLLER_ADDR,百度上游服务地址(默认值当前有效)。
- AUTH_APPID和AUTH_APPKEY,从百度官方获取的APPID和API Key的值。
- NEED_SAVE_AUDIO,是否保存合成语音,默认1为保存。
- TR_ENABLE,默认为1表示开启合成文本
正则替换
功能,详见./data/rules.dat
,注意,正则替换原则是按配置从上到下逐条进行匹配,因此建议将泛化能力强的正则放在上面,配置不当下面的正则会使上面的失效,请用户自行体验。不需要该功能可以关闭。 - 目前配置中,仅支持一种精品发音人:fduxiaowen,用户呼叫软件在进行合成请求时,发音人参数可以不填写,否则,请填写
fduxiaowen
。
合成效果
在mrcp-proxy.conf中可以通过修改参数更改效果。通过对VOICE_PITCH(音调)、VOICE_VOLUME(音量)和VOICE_SPEED(语速)参数的调整,可以获得不同的发声效果,更好满足您业务场景中的播报需求。
如音调稍高,声音听起来会显得年轻。
程序验证
首先,需要将程序lib库加入环境变量中,export LD_LIBRARY_PATH=${SERVER_ROOT}/mrcp-server/lib:$LD_LIBRARY_PATH
,注意将${SERVER_ROOT}修改为程序真实路径。
在主程序启动后,可使用自带的测试工具进行验证。conf/client-profiles/unimrcp.xml是测试工具的配置文件,需要将其中的unimrcpclient->settings->sip-settings->server-ip的值修改为主程序配置的IP,端口设置为主程序端口,如5060。
切换到 ${SERVER_ROOT}/mrcp-server/bin 目录下。
- 验证语音合成正确性,则执行
./unimrcpclient
,输入run synth
,等待一段时间,确保合成结束。合成的是mrcp-server/data
目录下的speak.xml文本,查看audio目录下是否有相应音频,如有错误,log目录下日志mrcp_debug.log可以看到相关信息。
注意,在输入识别或合成命令后,等待一段时间,确保识别或合成结束,再使用 quit
退出。使用help
查看帮助.
如果配置文件设置了NEED_SAVE_AUDIO,音频会在audio目录下保存,名称为{sn}.pcm,当前请求的sn可在日志文件mrcp_debug.log里查看。