文档中心
文档中心 / 语音识别
此文档自2018年3月起不再更新,建议访问 http://ai.baidu.com/docs#/ASR-API/top 来查看相关内容

语音识别

简介

本文档是百度语音开放平台iOS SDK的用户指南,描述了语音识别、长语音识别、语音唤醒等相关接口的使用说明。

兼容性

类别 兼容范围
系统 支持iOS 8.0及以上系统
架构 armv7、arm64、i386、x86_64(模拟器架构暂不支持离线功能)
网络 支持移动网络、WIFI等网络环境
开发环境 工程内使用了LTO等优化选项,建议使用最新版本Xcode进行开发

资源占用描述

静态库占用:

SDK类型 静态库大小 二进制增量 __TEXT增量
识别+唤醒 83.0M 1.9M 1.0M~1.2M

资源占用:

资源名称 资源描述 资源大小
bds_easr_basic_model.dat 基础语言模型 2.3M
bds_easr_input_model.dat 离线识别输入法模式语言模型。如无需使用离线输入法模式,可移除该文件。 56.8M
bds_easr_mfe_cmvn.dat MFE CMVN文件 690Byte
bds_easr_mfe_dnn.dat 基础资源文件,用于DNNMFE 39K
  1. 由于 BITCODE 开启会导致二进制文件体积增大,这部分会在 AppStore 发布时进行进一步编译优化,并不会引起最终文件的体积变化,故此处计算的是关闭 BITCODE 下的二进制增量。
  2. 虽然ipa的包会有增大,但实际在AppStore的优化下,用户下载的应用大小会远小于ipa文件的大小。

Release Notes

20180301: release 3.0.5.7

增加模拟器支持

20171214: release 3.0.5.6

进入后台不打断识别和唤醒;错误修复;

20171208

语音在线识别模型升级,大幅度提升识别准确率!