文档中心
文档中心 / 语音识别

语音识别

简介及运行环境

概述

本文档是百度语音开放平台Andriod SDK的用户指南,描述了语音识别、长语音识别、语音唤醒等相关接口的使用说明。
其中语音识别及长语音识别SDK内部均为采用流式协议,即用户边说边处理。区别于Rest api需要上传整个录音文件。

兼容性

类别 兼容范围
系统 支持Android 4.03 以上版本 API LEVEL 15
机型 手机和平板均可
硬件要求 要求设备上有麦克风
网络 支持移动网络(包括2G等)、WIFI等网络环境
开发环境 建议使用最新版本Android Studio 进行开发

SDK库文件

资源名称 资源大小 资源描述
bdasr_V3_xxx_xxx.jar 约130KB jar 库

NDK so库架构

共计5个架构目录:armeabi,armeabi-v7a,arm64-v8a,x86,x86_64,每个架构下均有以下5个so库文件。
如果为了节省安装包体积,可以只使用armeabi目录,性能损失微小。

资源名称 资源大小
libBaiduSpeechSDK.so 687K
libbd_easr_s1_merge_normal_20151216.dat.so 2.2M
libbdEASRAndroid.so 616K
libglobal.cmvn.so 1K
libvad.dnn.so 39K

DEMO压缩包说明

DEMO压缩包下载即可运行,其中DEMO内已经附带了SDK的库。

  • bdasr_V3_xxx_xxx.jar 位于 app/libs 目录下。
  • armeabi,armeabi-v7a,arm64-v8a,x86,x86_64 5个架构目录位于app\src\main\jniLibs 目录下

版本更新

  1. 长语音功能,不再限制之前的60s录音
  2. VAD(静音断句)的时长可以自定义
  3. 新增实验性VAD算法 DNN
  4. 新增音量回调,用于比如画波形图
  5. 众多bug修复和及优化