语音合成

更新时间：2024-04-02

语音合成

如需使用语音合成能力，则需在下载的Mrcp Server中对合成配置文件进行参数更改 {SERVER_ROOT}/mrcp-server/conf/mrcp-proxy.conf。确保AUTH_APPID和AUTH_APPKEY填写正确。

AUDIO_CONTROLLER_ADDR，百度上游服务地址(默认值当前有效)。
AUTH_APPID和AUTH_APPKEY，从百度官方获取的APPID和API Key的值。
NEED_SAVE_AUDIO，是否保存合成语音，默认1为保存。
TR_ENABLE，默认为1表示开启合成文本正则替换功能，详见./data/rules.dat，注意，正则替换原则是按配置从上到下逐条进行匹配，因此建议将泛化能力强的正则放在上面，配置不当下面的正则会使上面的失效，请用户自行体验。不需要该功能可以关闭。
目前配置中，仅支持一种精品发音人：fduxiaowen，用户呼叫软件在进行合成请求时，发音人参数可以不填写，否则，请填写fduxiaowen。

合成效果

在mrcp-proxy.conf中可以通过修改参数更改效果。通过对VOICE_PITCH（音调）、VOICE_VOLUME（音量）和VOICE_SPEED（语速）参数的调整，可以获得不同的发声效果，更好满足您业务场景中的播报需求。

如音调稍高，声音听起来会显得年轻。

程序验证

首先，需要将程序lib库加入环境变量中，export LD_LIBRARY_PATH=${SERVER_ROOT}/mrcp-server/lib:$LD_LIBRARY_PATH，注意将${SERVER_ROOT}修改为程序真实路径。

在主程序启动后，可使用自带的测试工具进行验证。conf/client-profiles/unimrcp.xml是测试工具的配置文件，需要将其中的unimrcpclient->settings->sip-settings->server-ip的值修改为主程序配置的IP，端口设置为主程序端口，如5060。

切换到 ${SERVER_ROOT}/mrcp-server/bin 目录下。

验证语音合成正确性，则执行 ./unimrcpclient，输入 run synth，等待一段时间，确保合成结束。合成的是 mrcp-server/data 目录下的speak.xml文本，查看audio目录下是否有相应音频，如有错误，log目录下日志mrcp_debug.log可以看到相关信息。

注意，在输入识别或合成命令后，等待一段时间，确保识别或合成结束，再使用 quit 退出。使用help查看帮助.

如果配置文件设置了NEED_SAVE_AUDIO，音频会在audio目录下保存，名称为{sn}.pcm，当前请求的sn可在日志文件mrcp_debug.log里查看。

语音识别

问题调试及错误码