写点什么

技术笔记(语音识别 - 语音噪声分类)

用户头像
攻城先森
关注
发布于: 2021 年 05 月 11 日
技术笔记(语音识别-语音噪声分类)

今天翻看以前的学习笔记,突然想把语音噪声分类来简单记录回顾一下。

噪声其实是指一切干扰正常信号特征的信号,即信号中不需要的特征。


根据噪声对语音频谱干扰方式的不同,可以将噪声分为加性噪声乘性噪声


加性噪声是指当噪声对语音的干扰表现为两者信号在时域进行相加;而显然噪声和语音频域中也为相加关系实际环境中背景噪声可以看成加性噪声,如风扇的声音、汽车引擎声、周围人说话声等;加性噪声是对背景噪声一种比较贴切的表述;麦克风等声音采集设备在正常工作的范围内,可以近似看成一个线性系统,即产生信号的幅度和声强呈正比;从能量角度看背景噪声和语音的声强是叠加关系,两者对麦克风共同作用形成的带噪语音信号等于各信号之和;目前针对这类噪声的研究最为常见。

乘性噪声是指噪声和语音在频域是相乘的关系,在时域和语音则是卷积关系,因此也称为卷积噪声;在实际应用中乘性噪声主要体现在语音采集、麦克风传输中电话信道和无线信道的频率选择特性;乘性噪声可以通过某种变换如同态滤波,转变为加性噪声。

白噪声是指功率谱密度在整个频域内均匀分布的噪声,所有频率具有相同能量的随机噪声称为白噪声。

粉红噪声定义为在与频带中心频率成正比的带宽(如倍频程带宽)内具有相等功率的噪声或振动;粉红噪声的频率分量功率其实主要集中在中低频段。

工厂噪声一般是指工业设备及其在运转时产生的噪声。

根据噪声统计特性随时间变化的程度不同,可将噪声分为周期噪声、脉冲噪声、缓变噪声和平稳噪声


周期噪声

发动机产生的干扰、市电干扰都是周期噪声;其特点在于频域上有很多离散的线谱;这种周期性噪声可以用梳状滤波器加以滤除,用数字信号处理的方法来处理;实际环境中产生的周期性噪声并非简单的只含线性谱分量,而是由许多窄带谱组成;该类型噪声往往是时变的,并与语音信号频谱重叠,往往需要采用自适应滤波的方式才可能自动识别和区分噪声。

脉冲噪声

打火、放电都会产生脉冲噪声;脉冲噪声表现为在时域波形中出现的窄脉冲,只要脉冲噪声不是太密,一般可用内插法来去除这种噪声。

缓变噪声

缓变噪声是在实际场合中经常遇到的噪声,这种噪声的统计特性会随着时间缓慢变化;人群噪声是典型的缓变噪声。

平稳噪声

平稳噪声是指噪声的统计特性不随时间发生变化;由于噪声源的复杂性,在日常生活中遇到的噪声大多是非平稳的,但对平稳噪声的研究是噪声分析的基础。


按照噪声覆盖频率范围可将噪声分为全频带噪声(也称为宽带噪声和窄带噪声)


全频带噪声

覆盖了信号全部频率带的噪声称为全频带噪声或宽带噪声;其来源有很多,如热噪声、气流(如风)、呼吸噪声、量化噪声以及各种随机噪声源;对于平稳的全频带噪声可认为是高斯白噪声;对于不具有白色频谱的噪声,可以先进行白化处理,然后转化为白噪声。

窄带噪声

只覆盖信号的部分频率带的噪声称为窄带噪声,又称为带选噪声;“口哨”噪声就是一种窄带噪声;

其他噪声

此外,根据不同学科领域研究的噪声类型还存在很多噪声分类,大家感兴趣的可以跟我留言谈论或者自行去学习一下。


发布于: 2021 年 05 月 11 日阅读数: 34
用户头像

攻城先森

关注

爱思考的小王学长 2021.04.23 加入

计算机在读硕士,两年ASR、Deep Learning学习开发经验

评论

发布
暂无评论
技术笔记(语音识别-语音噪声分类)