写点什么

语音信号处理 4:汉语中语音的分类及韵律特性

作者:轻口味
  • 2021 年 12 月 21 日
  • 本文字数:2560 字

    阅读完需:约 8 分钟

语音信号处理 4:汉语中语音的分类及韵律特性

1. 汉语中语音的分类

音素是指发出各不相同音的最小单位。在汉语中,音素可以构成声母和韵母。有时将含有声调的韵母称为调母。由单个调母或由声母与调母拼成的单位称为音节。音节在汉语中就是一个字的音。音节可以构成词,词可以构成句子。汉语共包括 22 个声母(包括零声母)和 38 个韵母。根据声母和韵母发音动作的不同,可以把音素分为辅音、单元音、复元音和复鼻尾音。

1.1 辅音

发辅音时声道的某处有一定的阻碍,这种阻碍是声道中活动部分与固定部分接触所形成的,接触点不同发出辅音的音色也就不同。具体接触点的位置可以有 11 个,可以根据这些接触点位置的不同将辅音分为六类:


  • 唇音

  • 舌尖前阻

  • 舌尖阻

  • 舌尖后阻

  • 舌面阻

  • 舌根阻


下表 2-1 中的横向所示。根据辅音发音过程中的具体阻碍方式,又可分为塞音、擦音、塞擦音、鼻音、边音等。发塞音时,声道中某部位处先呈闭塞状态,使气流无法通过,声音出现短暂的间歇,而后气流突破该障碍而涌出,产生一种很短促的声音,它经过声道共鸣后辐射出去。而擦音在声道中某部位处并不完全闭塞,形成一条很窄的缝隙,让气流挤出去形成湍流,擦音可以任意延长。塞擦音介于擦音和塞音之间,在开始阻碍处完全闭塞,气流无法通过,然后略微放松,让气流挤出去产生摩擦,形成先塞后擦的音。鼻音在口腔里阻碍处完全或几乎完全闭合,但软腭下降,打开通往鼻腔的通路,气流从鼻腔出去形成鼻音,鼻音也可以任意延长。边音的形成是舌尖形成阻碍不让气流通过,但舌头两边留出空隙让气流通过。辅音共有 22 个,包括除了零声母以外的全部声母以及韵母中的鼻韵尾音 ng/ŋ/。其中大部分辅音都是清辅音,只有 m, n, l, r 四个辅音在发音时声带产生振动,是浊辅音。辅音根据发音部位和发音方法的不同,可进行相应的分类,具体情况如下表所示。表 汉语辅音音素表



1.2 单元音

一般单元音有 13 个,此外还包括 7 个从国际音标的单元音音素借用的单元音。应该注意,元音并不等于韵母。元音、辅音是按着音素的发音特征来分类的;而声母和韵母则是按着音节的结构来分类的。尽管它们之间有一定的联系,但是两种不同的概念。单元音的音色由声道的形状决定,并且主要由舌头的形状及其在口腔中的位置、嘴唇的形状决定。根据舌头的高、中、低,舌位的前、中、后,以及嘴唇的开放程度,可以发出十多种不同的单元音。根据发音时舌位的高低和前后,以及唇形的圆扁,可将汉语中单元音进行分类,情况如下表所示。


表 汉语单元音分类表


全部元音都是浊音,声带都振动,比轻辅音响亮得多。其中舌尖前元音,舌尖后元音,以及卷舌元音是汉语语音所特有的元音音素。

1.3 复元音

元音中还有 13 个复合元音,它们都是韵母表中的韵母。所谓复合元音是由两个以上的元音连接而成的。其发音方法是:按复元音中单元音的顺序连续的移动舌位、唇形而发出的声音。需要注意的是,这种连接不是简单拼接,而是一种新的“动态”的声音。因为在连接时,舌位、唇形顺序连续的移动,相互的影响,并且结合得很紧,成为一种固定的音组,在发音的感觉和听音的感觉上等同于单元音,可以视为独立的语音单位。

1.4 复鼻尾音

复鼻尾音共 16 个,它们也都是韵母表中的韵母。在汉语中,鼻韵尾只有两个:-n,-ng。它们与元音复合之后也成为不可分割的音组。复鼻尾音音素的情况如下表所示。表 复鼻尾音音素分类表


音节是语流中最小的发音单位,它不仅是听觉上能够自然辨别出来的最小语音单位,也是音义结合的语言单位。从发音机制的角度看,一个音节对应着喉部肌肉的一次紧张,即肌肉紧张一次,就形成一个音节,紧张两次就形成两个音节,如汉语 xian 包含的一串音素,如果发音时肌肉紧张一次,就形成一个音节“鲜”,如果发音时肌肉紧张两次,就形成两个音节“西安”。每个音节发音时肌肉的紧张可以包含渐强、强峰和渐弱三个阶段,如果把这三个阶段的对应音分别称为起音、领音和收音的话,音节的构成模式有以下四种:


  1. 领音

  2. 起音+领音

  3. 领音+收音

  4. 起音+领音+收音。


一个音节可以没有起音和收音,但绝对不能没有领音,没有领音就不能构成音节。领音必须有相当的响度才能在听觉上觉察出音节的出现。


汉语语音中,充当领音的经常是元音(V),起音一般由辅音(C)充当,收音可以是元音,也可以是辅音。这样汉语音节结构的基本形式有 V、VC、CV、CVC 等。音节的这种宏观物理性质,可以作为汉语连续语音识别中音节切分的一种依据。领音处在喉头肌肉紧张度的强峰阶段,将形成音峰,对应于音节的中心。而渐弱阶段的尾端与另一次肌肉紧张渐强阶段的开端之间的地方是喉头肌肉紧张度的最低点,将形成音谷,对应于音节的边界,所以可以在音谷处进行音节切分。

2. 汉语语音的韵律特性

语音是一种特殊的声音,因此它具有声学特征的物理性质。语音的声学特征是指音色、音高、音长和音强,简称语音的四要素。


  • 音色也称音质,是一种声音区别于其他声音的基本特征。音色是由混入基音的倍音所决定的。每个人由于性别、年龄、喉部和声道构造的不同,产生倍音的成分也不相同,故具有各不相同的音色。也可以说,语音的音色与声带的振动频率、发音器官的送气方式和声道的形状、尺寸密切相关。

  • 音高指声音的高低,即对应前面所讨论的声调,汉语有阴平、阳平、上声和去声四种声调。从物理学角度来分析,音调的变化其实对应频率的变化,即其基频随声调的变化而变化。基频越高,声调越高。而声带的振动频率又决定于声带的长度、张力、厚薄和呼出气流的强弱。一位训练有素的歌唱家,能精确地运用这些变化而发出准确的音调。

  • 声音的长短叫作音长,它取决于发音持续时间的长短。

  • 音强主要指发音的轻重,一般存在三种重音:正常重音,对比重音和轻声。在词或短语的各音节中,若无轻声和对比重音,则就是正常重音,在没有中间停顿的一连串带正常重音的音节中,不论是一个短语还是复合词,其轻重程度是不完全相同的,其中最末音节最重,其次是第一个音节,中间音节最轻,如“展览馆”“篮球赛”等。正常重音的声学特点是声调的完整性和音长的加长,而不是音强的增加。对轻声,首先它失去了原有的声调,其次是它的音长大大缩短,如指物品的“东西”的“西”。对比重音与正常重音不同的地方在于它的音高范围更大、音长更长、音强也往往增加。


语音在音高、音强和音长方面所显示出来的抑扬顿挫的特性,也称为汉语的韵律特性。汉语中,主要靠音色和音高来区别语义,而音强和音长不能区别语义。关于语音的韵律特性还有待于进一步的研究。

发布于: 9 小时前阅读数: 9
用户头像

轻口味

关注

🏆2021年InfoQ写作平台-签约作者 🏆 2017.10.17 加入

Android、音视频、AI相关领域从业者。 邮箱:qingkouwei@gmail.com

评论

发布
暂无评论
语音信号处理 4:汉语中语音的分类及韵律特性