文档中心
文档中心 / 语音合成

语音合成

简介

概念解释

语音合成是实现人机语音交互,建立一个有听和讲能力的交互系统所必需的关键技术。随着语音技术的发展,百度自主研发了语音合成系统(TTS),功能是接收用户发送的文本,生成语音发送给用户。
对本文中将提到的名词约定如下:
语音合成(Text To Speech,TTS):将文本合成为语音,即声音文件。
合成引擎:将文本合成为语音的核心模块。
百度语音合成SDK(BDTTSClient):本开发包。BDTTSClient是一个封装了网络首发、音频播放功能的语音合成解决方案。借助BDTTSClient可以在应用程序中快速集成语音合成功能。

功能介绍

百度语音合成客户端Android版SDK是一种面向Android移动设备的语音合成解决方案,以JAR包 + SO库的形式发布。目前版本已支持SDK内部直接播放合成语音和从SDK获取语音数据,并支持男女声、语速、音调、音量、音频码率设置,后续版本讲支持更多参数设置(最新信息请参见百度语音官网)。

兼容性

系统:支持Android 2.3(API Level 9)及以上系统。需要开发者通过minSdkVersion来保证支持系统的检测。
机型:手机和平板均可。
构架:支持arm64-v8a,armeabi,armeabi-v7a,x86,x86_64。
网络:支持WIFI及移动网络,支持2G、3G、4G移动网络。

开发包说明

文件(夹)名 说明
doc/百度语音离在线合成Android版开发手册.pdf 本文档
doc/javaDoc Javadoc
libs 语音合成SDK Lib库,包括各平台的so库及Jar包
BaiduTtsSample 开发示例(Eclipse project)
data 语音合成资源文件
license 授权文件

总体框图