语音信号数字化
语音信号数字化之前,必须先进行防混叠滤波及防工频干扰滤波。其中防混叠滤波指滤除高于 1/2 采样频率的信号成分或噪声,使信号带宽限制在某个范围内;否则,如果采样率不满足采样定理,则会产生频谱混叠,此时信号中的高频成分将产生失真;而工频干扰指 50Hz 的电源干扰。
语音信号是时间和幅度都连续变化的一维模拟信号,要想在计算机中对它进行处理,就要先进行采样和量化,将它变成时间和幅度都离散的数字信号在语音信号处理中,需要将信号表示成可以处理的函数的形式。对于模拟信号 xa(t),它表示函数值随着连续时间变量 t 的变化趋势。如果以一定的时间间隔 T 对这样的连续信号取值,则连续信号 xa(t)即变成离散信号 x(n)=xa(nT),这个过程称为采样,其中两个取样点之间的间隔 T 称为采样周期,它的倒数 Fs 称为采样频率。根据采样定理,当采样频率大于信号最高频率的两倍时,在采样过程中就不会丢失信息,并且可以用采样后的信号重构原始信号。实际的信号常有一些低能量的频谱分量超过采样频率的一半,如浊音的频谱超过 4kHz 的分量比其峰值至少要低 40dB;而对于清音,即使超过 8kHz,频率分量也没有显著下降,因此语音信号所占的频率范围可以达到 10kHz 以上。虽然这样,但对语音清晰度有明显影响部分的最高频率为 5.7kHz 左右。CCITT(国际电报电话咨询委员会)提出的 G.711 标准建议采样频率为 8kHz,但一般情况下这只适合电话语音的情况,因为电话语音的频率为 60 ~ 3400Hz。在实际的语音信号处理中,采样频率一般为 8 ~ 10kHz。有一些系统为了实现更高质量的语音合成,或者使语音识别系统得到更高的识别率,将可处理的语音信号扩展到 7 ~ 9kHz,这时的采样频率一般为 15 ~ 20kHz。
版权声明: 本文为 InfoQ 作者【轻口味】的原创文章。
原文链接:【http://xie.infoq.cn/article/e857f7ab5952346337c6dab46】。文章转载请联系作者。
评论