语音信号处理 3:语音信号处理的的整体结构
从总体上看,语音信号处理过程可以用一个统一的框架来表示,其结构如下图所示。
图 语音信号处理的总体结构框图从这个总体结构可以看出:无论是语音识别,还是语音编码与合成,输入的语音信号首先要进行预处理,对信号进行适当放大和增益控制,并进行反混叠滤波来消除工频信号的干扰;然后进行数字化,将模拟信号转化为数字信号,便于用计算机来处理;接着进行特征提取,用反映语音信号特点的若干参数来代表语音。在此之后,根据任务的不同,采取不同的处理办法。对语音识别技术,它分为两个阶段:训练阶段,将用特征参数形式表示的语音信号进行相应的处理,获得表示识别基本单元共性特点的标准数据,以此构成参考模板,将所有能识别的基本单元的参考模板结合在一起形成参考模式库;识别阶段,将待识别的语音经特征提取后逐一与参考模式库中的各个模板按某种原则进行比较,找出最相像的参考模板所对应的发音,即为识别结果。对语音编码与合成技术,都是将语音信号进行某种压缩处理;如果是语音编码,则对编码后的语音信号进行传输,在接收端进行解压缩回放播出;如果是语音合成,则对编码后的语音信号进行存储,待需要的时候进行解压缩回放播出。本书在后续章节中将以上述总体结构为线索,从共性的技术到个性的特点,就各部分的具体内容进行充分地展开和详细地介绍。
评论