型表示,有
HzSzIz11a
z
1p
式中,Sz和Iz分别为语音信号s
和激励源i
的Z变换。
对人的听觉来说,浊音是最重要的语音信号。对于浊音,模型的激励信号源e
是以基音周期重复的单位脉冲,此时有
Sz11a
z
1p
Iz1
。可得s
的Z变换Sz为
(17)
式中,
aii12p
为P阶线性预测系数。根据倒谱的定义,对具有最小相位特征的语音
信号s
,有
l
SzCzc
z
1
(18)
1
式中,c
为语音信号的倒谱。将式16代入式17,并对两边z求导,得
c1a1
1kc
a
1akc
k1
p
k1
(19)
根据上式即可由线性预测系数通过递推得到倒谱系数,将这样得到的倒谱称为线性预测倒谱系数2语音数据压缩技术要实现低速率、高质量和少容量的语音编码必须采用信息压缩技术。语音信息压缩技术可分为两类波形处理技术和量化技术。波形处理技术的目标是削减语音波形的冗余度包括线性预测分析、频带分割、正交变换和分析合成等。量化技术的目标是在幅度量化上实现优化。媒体的内容语义是基于内容检索的基础与任务有关也与领域有关。基于内容的检索应该阶段完成第一阶段先用无领域知识的方法缩小检索空间第二阶段再逐步利用领域知识进行更细致的查找和匹配。声音的内容检索包括特定模式的查找特定词、短语、音乐旋律和特定声音的查找等。早期的研究更多的是致力于语音内容的识别。但对数据库来说查找非语音信号可能会更有效例如讲话人的性别声音的间隔特殊的背景于前景声的组合等。由于声音常常伴随其它媒体存在寻找这些特征有利于对其它媒体的检索。例如在足球比赛时一阵大声的喧哗可能意味着进了球只要能够检索出这段声音对视频的索引也就可以基本确定。特征匹配是基于内容检索最关键的部分。
f从上述论述可以知道基于内容的语音检索中的关键技术是语音特征的提取。建立分层的语音特征表示将有利于特征提取同时也便于不同层次的语音信息的检索与新的信息发现。现代数字信号处理的进步都能在语音信号处理技术中得到应用。语音信号是最能体现信号非线性的一个领域。现代数字信号处理的一个主要发展趋势是对非线性、非平稳信号的研究。因此循环平稳信号分析、多谱分析和时频尺度理论对于语音信号的表示关键特征的捕捉有很重要的应用前景。在此基础上结合语音语义理论的研r