文档中心
文档中心 / 语音合成

语音合成

在线语音合成 Java SDK

Java SDK文档

简介

Hi,您好,欢迎使用百度语音合成服务。

本文档主要针对Java开发者,描述百度语音合成接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

  • 在语音官网问答社区内新建提问,标签选择“识别-RESTAPI”;
  • 加入开发者QQ群:648968704

接口能力

接口名称 接口能力简要描述
语音合成 将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的口语输出的技术。

注意事项

目前本SDK的功能同REST API,需要联网调用http接口 。REST API 仅支持最多512字(1024 字节)的音频合成,合成的文件格式为mp3。 没有其他额外功能。 如果需要使用离线合成等其它功能,请使用Android或者iOS 合成 SDK

请严格按照文档里描述的参数进行开发。请注意以下几个问题:

  1. 合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。切忌不可文本长度超过限制。

  2. 语音合成 rest api初次申请默认请求数配额 200000次/天,如果默认配额不能满足需求,请申请提高配额。

  3. 必填字段中,严格按照文档描述中内容填写。

版本更新记录

上线日期 版本号 更新内容
2017.8.25 3.0.0 更新sdk打包方式:所有AI服务集成一个SDK
2017.7.14 1.0.1 更新sdk打包方式
2017.6.30 1.0.0 新增语音合成服务接口

快速入门

安装Speech Java SDK

Speech Java SDK目录结构

  1. com.baidu.aip
  2. ├── auth //签名相关类
  3. ├── http //Http通信相关类
  4. ├── client //公用类
  5. ├── exception //exception类
  6. ├── speech
  7. └── AipSpeech //AipSpeech类
  8. └── util //工具类

支持 JAVA版本:1.7+

查看源码
Java SDK代码现已公开,您可以查看代码、或者在License范围内修改和编译SDK以适配您的环境。
github链接:https://github.com/Baidu-AIP/java-sdk

使用maven依赖:

添加以下依赖即可。其中版本号可在maven官网查询

  1. <dependency>
  2. <groupId>com.baidu.aip</groupId>
  3. <artifactId>java-sdk</artifactId>
  4. <version>${version}</version>
  5. </dependency>

直接使用JAR包步骤如下:

1.在官方网站下载Java SDK压缩工具包。

2.将下载的aip-java-sdk-version.zip解压后,复制到工程文件夹中。

3.在Eclipse右键“工程 -> Properties -> Java Build Path -> Add JARs”。

4.添加SDK工具包aip-java-sdk-version.jar和第三方依赖工具包json-20160810.jar

其中,version为版本号,添加完成后,用户就可以在工程中使用Speech Java SDK。

新建AipSpeech

AipSpeech是语音识别的Java客户端,为使用语音识别的开发人员提供了一系列的交互方法。

用户可以参考如下代码新建一个AipSpeech:

  1. public class Sample {
  2. //设置APPID/AK/SK
  3. public static final String APP_ID = "你的 App ID";
  4. public static final String API_KEY = "你的 Api Key";
  5. public static final String SECRET_KEY = "你的 Secret Key";
  6. public static void main(String[] args) {
  7. // 初始化一个AipSpeech
  8. AipSpeech client = new AipSpeech(APP_ID, API_KEY, SECRET_KEY);
  9. // 可选:设置网络连接参数
  10. client.setConnectionTimeoutInMillis(2000);
  11. client.setSocketTimeoutInMillis(60000);
  12. // 可选:设置代理服务器地址, http和socket二选一,或者均不设置
  13. client.setHttpProxy("proxy_host", proxy_port); // 设置http代理
  14. client.setSocketProxy("proxy_host", proxy_port); // 设置socket代理
  15. // 调用接口
  16. TtsResponse res = client.synthesis("你好百度", "zh", 1, null);
  17. System.out.println(res.getErrorCode());
  18. byte[] data = res.getData();
  19. }
  20. }

在上面代码中,常量APP_ID在百度云控制台中创建,常量API_KEYSECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。

配置AipSpeech

如果用户需要配置AipSpeech的一些细节参数,可以在构造AipSpeech之后调用接口设置参数,目前只支持以下参数:

接口 说明
setConnectionTimeoutInMillis 建立连接的超时时间(单位:毫秒)
setSocketTimeoutInMillis 通过打开的连接传输数据的超时时间(单位:毫秒)
setHttpProxy 设置http代理服务器
setSocketProxy 设置socket代理服务器 (http和socket类型代理服务器只能二选一)

接口说明

语音合成

接口描述

基于该接口,开发者可以轻松的获取语音合成能力

请求说明

  • 合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。文本长度不可超过限制

举例,要把一段文字合成为语音文件:

  1. public void synthesis(AipSpeech client)
  2. {
  3. TtsResponse res = client.synthesis("你好百度", "zh", 1, null);
  4. System.out.println(res.getErrorCode());
  5. // 设置可选参数
  6. HashMap<String, Object> options = new HashMap<String, Object>();
  7. options.put("spd", "5");
  8. options.put("pit", "5");
  9. options.put("per", "4");
  10. TtsResponse res = client.synthesis("你好百度", "zh", 1, options);
  11. System.out.println(res.getErrorCode());
  12. byte[] data = res.getData();
  13. }
参数 类型 描述 是否必须
tex String 合成的文本,使用UTF-8编码,请注意文本长度必须小于1024字节
lang String 语言选择,填写zh
ctp String 客户端类型选择,web端填写1
cuid String 用户唯一标识,用来区分用户,填写机器 MAC 地址或 IMEI 码,长度为60以内
spd String 语速,取值0-9,默认为5中语速
pit String 音调,取值0-9,默认为5中语调
vol String 语速,取值0-15,默认为5中语速
per String 发音人选择, 0为女声,1为男声,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女

返回样例:

返回TtsResponse类。
如果合成成功,error_code=0, 下行数据为二进制语音文件,包含在data中。
如果合成出现错误,则会填充除data属性外的其它属性。

返回失败:

  1. // 失败返回
  2. {
  3. "err_no":500,
  4. "err_msg":"notsupport.",
  5. "sn":"abcdefgh",
  6. "idx":1
  7. }

错误信息

错误返回格式

若请求错误,服务器将返回的JSON文本包含以下参数:

  • error_code:错误码。
  • error_msg:错误描述信息,帮助理解和解决发生的错误。

错误码

SDK本地检测参数返回的错误码

error_code error_msg 备注
SDK108 connection or read data time out 连接超时或读取数据超时

服务端返回的错误码

错误码 含义
500 不支持的输入
501 输入参数不正确
502 token验证失败
503 合成后端错误