【百度语音合成】JavaAPI方式语音合成示例
756665228 发布于2017-12-06 09:10 浏览:131 回复:5
4
收藏
  • Java-SDK合成语音示例:http://ai.baidu.com/forum/topic/show/492725
  • REST-API文档地址:http://ai.baidu.com/docs#/TTS-API/top

本帖子主要示例通过REST API进行语音合成。使用Java语言进行示例Demo测试

  • 创建语音应用并获取apikey secretkey 

通过GET方式获取access_token并保存备用

24.259f1f35b9f628b5910d4264593aeffe.2592000.1515113352.282335-123456
  • 写一个适合语音合成的HTTP方法

看过RESTAPI文档会得知请求方式为GET 返回的内容是音频文件的流对象 并且默认返回是MP3格式 

Content-type--->[audio/mp3]

那我们就写一个HTTP得到数据并保存为MP3的方法

  /**
     * 语音合成HTTP方法
     * @param requestUrl 请求的接口地址 拼接access_token后的
     * @param params 语音合成的参数
     * @throws Exception
     */
    public static String postVoice(String requestUrl,String params) throws Exception {
    	String workspace = System.getProperty("user.home");
    	String path = workspace+"/text2audio/";
    	try {
			if (!(new File(path).isDirectory())) {
				new File(path).mkdir();
			}
		} catch (SecurityException e) {
			e.printStackTrace();
		}
    	String filePath = path+"VOICE"+new Date().getTime()/1000+".mp3";
        String generalUrl = requestUrl;
        URL url = new URL(generalUrl);
        System.out.println(generalUrl);
        // 打开和URL之间的连接
        HttpURLConnection connection = (HttpURLConnection) url.openConnection();
    	System.out.println("打开链接,开始发送请求"+new Date().getTime()/1000);
        connection.setRequestMethod("POST");
        // 设置通用的请求属性
        connection.setRequestProperty("Content-Type", "application/x-www-form-urlencoded");
        connection.setRequestProperty("Connection", "Keep-Alive");
        connection.setUseCaches(false);
        connection.setDoOutput(true);
        connection.setDoInput(true);

        // 得到请求的输出流对象
        DataOutputStream out = new DataOutputStream(connection.getOutputStream());
        out.writeBytes(params);
        out.flush();
        out.close();

        // 建立实际的连接
        connection.connect();
        // 获取所有响应头字段
        Map<String, List<String>> headers = connection.getHeaderFields();
        // 遍历所有的响应头字段
        for (String key : headers.keySet()) {
        		System.out.println(key + "--->" + headers.get(key));
        }
        // 定义 BufferedReader输入流来读取URL的响应
        InputStream inputStream = connection.getInputStream();
        FileOutputStream outputStream = new FileOutputStream(filePath);
        byte[] buffer = new byte[1024];
        int len = -1;
        while ((len=inputStream.read(buffer))!=-1) {
        	outputStream.write(buffer,0,len);
		}
        outputStream.close();
        System.out.println("请求结束"+new Date().getTime()/1000);
        System.out.println("MP3文件保存目录:" + filePath);
        return filePath;
    }
  • 根据文档得知需要一个CUID的值

请求参数需要一个cuid用户唯一标识,用来区分用户,计算UV值。长度为60字符以内 那就再写一个简单的随机数方法

import java.util.Random;

/**
 * 获取指定长度的随机字符串
 * @author 小帅丶
 * @Title RandomStringGenerator
 * @时间   2017-5-26下午4:58:53
 */
public class RandomStringGenerator {

    /**
     * 获取一定长度的随机字符串
     * @param length 指定字符串长度
     * @return 一定长度的字符串
     */
    public static String getRandomStringByLength(int length) {
        String base = "abcdefghijklmnopqrstuvwxyz0123456789";
        Random random = new Random();
        StringBuffer sb = new StringBuffer();
        for (int i = 0; i < length; i++) {
            int number = random.nextInt(base.length());
            sb.append(base.charAt(number));
        }
        return sb.toString();
    }

}

-----------------------------------------------------接下来进行文本合成语音的示例代码-----------------------------------------------------

  • Java-API方式语音合成示例代码
package com.xs.audio.tns;
import java.net.URLEncoder;
import com.xs.common.APIContants;
import com.xs.util.baidu.HttpUtil;
import com.xs.util.baidu.RandomStringGenerator;
/**
 * 百度语音合成JavaDemo(非官方)
 * @author 小帅丶
 * @date  2017-5-26上午11:17:32
 */
public class Text2Audio {
	public String TEXT2AUDIO_URL = "http://tsn.baidu.com/text2audio";
	public static void main(String[] args) throws Exception {
		String tex = "开发者小帅你好";
		Text2Audio audio = new Text2Audio();
		audio.text2Audio(tex, "开始要求保存的AccessToken", "1", RandomStringGenerator.getRandomStringByLength(60));
	}
	/**
	 * 所有参数方法
	 * @Title text2Audio
	 * @param tex	必填	合成的文本,使用UTF-8编码,请注意文本长度必须小于1024字节
	 * @param lan	必填	语言选择,填写zh
	 * @param tok	必填	开放平台获取到的开发者access_token
	 * @param ctp	必填	客户端类型选择,web端填写1
	 * @param cuid	必填	用户唯一标识,用来区分用户,填写机器 MAC 地址或 IMEI 码,长度为60以内
	 * @param spd	选填	语速,取值0-9,默认为5中语速
	 * @param pit	选填	音调,取值0-9,默认为5中语调
	 * @param vol	选填	音量,取值0-9,默认为5中音量
	 * @param per	选填	发音人选择, 0为女声,1为男声,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女声
	 * @author 小帅丶
	 * @throws Exception 
	 * @date 2017-5-26
	 */
	@SuppressWarnings("static-access")
	public void text2Audio(String tex,String tok,String ctp,String cuid,String spd,String pit,String vol,String per) throws Exception{
		String params = "tex=" + URLEncoder.encode(tex, "UTF-8")
				+ "&lan=zh&cuid=" + cuid + "&ctp=1&tok=" + tok + "&spd=" + spd
				+ "&pit=" + pit + "&vol=" + vol + "&per=" + per;
		System.out.println(params);
		HttpUtil httpUtil = new HttpUtil();
		String data = httpUtil.postVoice(TEXT2AUDIO_URL,params);
		System.out.println("文件保存路径:"+data);
	}
	/**
	 * 必填参数方法
	 * @Title text2Audio
	 * @param tex	必填	合成的文本,使用UTF-8编码,请注意文本长度必须小于1024字节
	 * @param lan	必填	语言选择,填写zh
	 * @param tok	必填	开放平台获取到的开发者access_token
	 * @param ctp	必填	客户端类型选择,web端填写1
	 * @param cuid	必填	用户唯一标识,用来区分用户,填写机器 MAC 地址或 IMEI 码,长度为60以内
	 * @author 小帅丶
	 * @throws Exception 
	 * @date 2017-5-26
	 */
	@SuppressWarnings("static-access")
	public void text2Audio(String tex,String tok,String ctp,String cuid) throws Exception{
		String params = "tex=" + URLEncoder.encode(tex, "UTF-8")
				+ "&lan=zh&cuid=" + cuid + "&ctp=1&tok=" + tok;
		System.out.println(params);
		HttpUtil httpUtil = new HttpUtil();
		String data = httpUtil.postVoice(TEXT2AUDIO_URL,params);
		System.out.println("文件保存路径:"+data);
	}
}

 

参数无误会返回MP3的存放路径

MP3文件保存目录:C:\Users\Administrator/text2audio/VOICE1512521962.mp3
文件保存路径:C:\Users\Administrator/text2audio/VOICE1512521962.mp3

以上就是JavaAPI方式语音合成示例

下一贴会发布Java方法实现MP3转PCM 并进行语音识别示例代码

收藏
点赞
4
个赞
共5条回复 最后由756665228回复于2017-12-06 11:36
#2卡农LLLL回复于2017-12-06

期待下一贴...赞一个.

1
#3756665228回复于2017-12-06
  • 语音识别的示例:http://ai.baidu.com/forum/topic/show/496730 
1
#4goJhou回复于2017-12-06

7叔,使命必答。江湖人称 家哇杀手

0
#5fujiayi1984回复于2017-12-06

感谢分享,几个点可以优化下:

1. 合成建议用GET方式,url可以打印出来,浏览器中可以复现,方便排查。

2. CUID是为了计算uv的,理论上一个SDK或者一个用户应该使用一个CUID。

3. 文档中的“需要根据 Content-type的头部来确定是否服务端合成成功。”这句没有实现。

 

另外官方的java rest sdk是开源的,可以参考对比下。

另外rest api的功能仅仅是语音的一个小功能,更多的欢迎使用android或者ios。

1
#6756665228回复于2017-12-06
#5 fujiayi1984回复
感谢分享,几个点可以优化下: 1. 合成建议用GET方式,url可以打印出来,浏览器中可以复现,方便排查。 2. CUID是为了计算uv的,理论上一个SDK或者一个用户应该使用一个CUID。 3. 文档中的“需要根据 Content-type的头部来确定是否服务端合成成功。”这句没有实现。   另外官方的java rest sdk是开源的,可以参考对比下。 另外rest api的功能仅仅是语音的一个小功能,更多的欢迎使用android或者ios。
展开

嗯嗯。谢谢官方的建议。后续我也会测试一下移动端的哦。

1
TOP
切换版块