种声音可以互相掩蔽一种声音的出现可能使得另一种声音难于听清。它分为听觉屏蔽、频谱屏蔽和瞬态屏蔽。频谱屏蔽是高电平音调使附近频率的低电平声音不能被人耳听到。声音的屏蔽特性可以用于声音特别是语音信号的压缩。2语音编码语音编码分为三类波形编码、参量编码和混合编码。波形编码是将时域信号直接变换为数字代码其目的是尽可能精确地再现原来的话音波形。自适应量化、自适应比特分配和矢量量化等等。2在语音识别与合成中的应用语音识别的研究是从20世纪50年代开始的但直到60年代中期才取得了实质性进展其重要标志就是日本学者Itakura将动态规划算法用于解决语音识别中语速多变的难题提出了动态时间收缩算法DTWDy2
amicTimeWarpi
g。其基本思想是在训练阶段从词汇表中通过语音信号处理技术提出每个词的特征向量时域特征、频域特征、尺度特征及联合分布特征作为标准模板存入模板库中。在识别阶段将输入语音的特征向量依次与模板库中的各个标准模板进行比较计算类似度将类似度最高的标准模板所对应的词汇输
f出。在这里和一般的模式识别不一样存在几个问题说话者语速不一致的问题大词汇表的问题导致计算量大的问题协同发音的问题即同一音素的发音随上下文不同而变化对于非特定人语音识别还有一个语音多变性的困难。语音识别的这些问题除了在优化算法上应有所突破外一个最根本的问题是语音特征量的提取问题。目前能够用于模板匹配的特征向量还不能达到少而精的要求。能够反映特定人和非特定人在语速变化下的不变特征量、在连续语音识别中的协同发音不变量等特征量还有待进一步的研究。这些工作的进展依赖于语音信号处理技术及一般的信号处理技术的突破。语音合成技术就是所谓“会说话的机器”。它可分为三类波形编码合成、参数式合成和规则合成。波形编码合成以语句、短语、词或音节为合成单元。合成单元的语音信号被录取后直接进行数字编码经数据压缩组成一个合成语音库。重放时根据待输出的信息在语音库中取出相应的合成单元的波形数据将它们连接在一起经解码还原成语音。参数式合成以音节或音素为合成单元。首先对所有待合成单元的语音进行分析提取有关语音参数将其编码后组成合成语音库。输出时根据待合成的语音信息从语音库中取出相应的合成参数经编辑和连接顺序送入语音合成器。语音合成器在合成参数的控制下重新还原语音波形。规则合成则是通过语音学规则产生语音。3多媒r