音识别技术详细介绍及应用前景分析
作者未知
专题来源网络
点击数518
更新时间2006825
语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一它是一门交叉学科正逐步成为信息技术中人机接口的关键技术语音识别技术与语音合成技术结合使人们能够甩掉键盘通过语音命令进行操作语音技术的应用已经成为一个具有竞争性的新兴高技术产业
语音识别技术
与机器进行语音交流让机器明白你说什么这是人们长期以来梦寐以求的事情语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术语音识别是一门交叉学科近二十年来语音识别技术取得显著进步开始从实验室走向市场人们预计未来10年内语音识别技术将进入工业家电通信汽车电子医疗家庭服务消费电子产品等各个领域
语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一
语音识别技术的基础
语音识别技术关系到多学科的研究领域不同领域上的研究成果都对语音识别的发展作了贡献
让机器识别语音的困难在某种程度上就像一个外语不好的人听外国人讲话一样它和不
f同的说话人不同的说话速度不同的说话内容以及不同的环境条件有关语音信号本身的特点造成了语音识别的困难这些特点包括多变性动态性瞬时性和连续性等
计算机语音识别过程与人对语音识别处理过程基本上是一致的目前主流的语音识别技术是基于统计模式识别的基本理论一个完整的语音识别系统可大致分为三部分
1语音特征提取其目的是从语音波形中提取出随时间变化的语音特征序列
2声学模型与模式匹配识别算法声学模型通常将获取的语音特征通过学习算法产生在识别时将输入的语音特征同声学模型模式进行匹配与比较得到最佳的识别结果
3语言模型与语言处理语言模型包括由识别语音命令构成的语法网络或由统计方法构成的语言模型语言处理可以进行语法语义分析对小词表语音识别系统往往不需要语言处理部分
声学模型是识别系统的底层模型并且是语音识别系统中最关键的一部分声学模型的目的是提供一种有效的方法计算语音的特征矢量序列和每个发音模板之间的距离声学模型的设计和语言发音特点密切相关声学模型单元大小字发音模型半音节模型或音素模型对语音训练数据量大小系统识别率以及灵活性有较大的影响必须根据不同语言的特r