文档中心
文档中心 / 语音识别

语音识别

简介

简介

百度语音识别通过 REST API 的方式给开发者提供一个通用的 HTTP 接口。
上传需要完整的录音文件,录音文件时长不超过60s。

语种

普通话、粤语、英文

适用范围

任意操作系统,任意编程语言,只要可以对百度语音服务器发起http请求的,均可以使用本接口。
浏览器由于无法跨域请求百度语音服务器的域名,因此无法使用本接口。

语音格式

格式支持:cm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。推荐pcm
采样率 :8k 或者 16k 。推荐16K。
编码:16bit 位深的单声道。

百度服务端会将非pcm格式,转为pcm格式,因此使用wav、amr会有额外的转换耗时。

样例文件下载

SDK

目前对识别和合成的REST API,均封装了 Java、Python、PHP、C#、NodeJs 共5种开发语言的SDK。功能等同于REST API。SDK中 识别使用JSON方式提交本地文件。