开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语音技术

    语音合成

    语音合成

    如需使用语音合成能力,则需在下载的Mrcp Server中对合成配置文件进行参数更改 {SERVER_ROOT}/mrcp-server/conf/mrcp-proxy.conf。确保AUTH_APPID和AUTH_APPKEY填写正确。

    • AUDIO_CONTROLLER_ADDR,百度上游服务地址(默认值当前有效)。
    • AUTH_APPID和AUTH_APPKEY,从百度官方获取的APPID和API Key的值。
    • NEED_SAVE_AUDIO,是否保存合成语音,默认1为保存。
    • TR_ENABLE,默认为1表示开启合成文本正则替换功能,详见./data/rules.dat,注意,正则替换原则是按配置从上到下逐条进行匹配,因此建议将泛化能力强的正则放在上面,配置不当下面的正则会使上面的失效,请用户自行体验。不需要该功能可以关闭。
    • 目前配置中,仅支持一种精品发音人:fduxiaowen,用户呼叫软件在进行合成请求时,发音人参数可以不填写,否则,请填写fduxiaowen

    合成效果

    在mrcp-proxy.conf中可以通过修改参数更改效果。通过对VOICE_PITCH(音调)、VOICE_VOLUME(音量)和VOICE_SPEED(语速)参数的调整,可以获得不同的发声效果,更好满足您业务场景中的播报需求。

    如音调稍高,声音听起来会显得年轻。

    程序验证

    首先,需要将程序lib库加入环境变量中,export LD_LIBRARY_PATH=${SERVER_ROOT}/mrcp-server/lib:$LD_LIBRARY_PATH,注意将${SERVER_ROOT}修改为程序真实路径。

    在主程序启动后,可使用自带的测试工具进行验证。conf/client-profiles/unimrcp.xml是测试工具的配置文件,需要将其中的unimrcpclient->settings->sip-settings->server-ip的值修改为主程序配置的IP,端口设置为主程序端口,如5060。

    切换到 ${SERVER_ROOT}/mrcp-server/bin 目录下。

    1. 验证语音合成正确性,则执行 ./unimrcpclient,输入 run synth,等待一段时间,确保合成结束。合成的是 mrcp-server/data 目录下的speak.xml文本,查看audio目录下是否有相应音频,如有错误,log目录下日志mrcp_debug.log可以看到相关信息。

    注意,在输入识别或合成命令后,等待一段时间,确保识别或合成结束,再使用 quit 退出。使用help查看帮助.

    如果配置文件设置了NEED_SAVE_AUDIO,音频会在audio目录下保存,名称为{sn}.pcm,当前请求的sn可在日志文件mrcp_debug.log里查看。

    上一篇
    语音识别
    下一篇
    问题调试及错误码