写点什么

esp32~MP3 音频文件学习

用户头像
Android架构
关注
发布于: 1 小时前

1. 编码

从信息论的观点来看,描述信源的数据是信息和数据冗余之和,即:数据=信息+数据冗余。音频信号在时域和频域上具有相关性,也即存在数据冗余。将音频作为一个信源,音频编码的实质是减少音频中的冗余。


自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即 PCM 编码。PCM 通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

2. 比特率

是指每秒传送的比特(bit)数。单位为 bps(Bit Per Second),比特率越高,传送的数据越大。在音频、视频领域,比特率常翻译为码率,比特率表示经过编码(压缩)后的音、视频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最小的单位,要么是 0,要么是 1。比特率与音、视频压缩的关系,简单的说就是比特率越高,音频、视频的质量就越好,但编码后的文件就越大;如果比特率越少则情况刚好相反。


比特率 = 采样率 * 采样位数 * 声道数

3. 码率/码流/位率:

是指音频、视频文件在单位时间内使用的数据流量,通俗一点的理解就是取样率,是音频、视频编码中质量控制中最重要的部分,一般我们用的单位是 Kb/s、Mb/s。一般来说码流越大,压缩比就越小,质量就越高。码流越大,说明单位时间内取样率越大,数据流,精度就越高,处理出来的文件就越接近原始文件。

4. MP3 简述

MP3 全称为 MPEG Audio Layer 3,它是一种高效的计算机音频编码方案,它以较大的压缩比将音频文件转换成较小的扩展名为.mp3 的文件,基本保持源文件的音质,MP3 是 ISO/MPEG 标准的一部分,


ISO/MPEG 标准描述了使用高性能感知编码方案的音频压缩,此标准一直在不断更新以满足“质高量小”的追求,现已形成 MPEG Layer1、Layer2、Layer3 三种音频编解码方案,分别对应 MP1、MP2、MP3 这三种声音文件


MPEG(Moving Picture Expert Group)是 ISO 下的一个动态图像专家组,它指定的 MPEG 标准广泛的应用于各种多媒体中,MPEG 标准包括视频和音频标准,其中音频标准已制定出 MPEG-1、MPEG-2、MPEG-2 ACC、MPEG-4。MPEG-1 和 MPEG-2 标准使用同一个音频编解码族 Layer1、2、3,MP3 绝大多数使用的是 MPEG1 标准


MP3 音频压缩包含编码和解码两部分,编码是将原始信号转换成电平信号的过程,解码即是逆过程,MP3 采用了感知音频编码(PerceptualAudio Coding)这一失真算法。人耳感受声音的频率范围是 20Hz-20kHz,MP3 截掉了大量的冗余信号和无关的信号,编码器通过混合滤波器组将原始声音变换到频率域,利用心理声学模型,估算刚好能被察觉到的噪声水平,再经过量化,转换成 Huffman 编码,形成 MP3 位流。解码器要简单得多,它的任务是从编码后的谱线成分中,经过反量化和逆变换,提取出声音信号。

5. MP3 文件结构

用户头像

Android架构

关注

还未添加个人签名 2021.10.31 加入

还未添加个人简介

评论

发布
暂无评论
esp32~MP3音频文件学习