写点什么

Android 音视频——相关概念

作者:程思扬
  • 2022 年 5 月 04 日
  • 本文字数:2963 字

    阅读完需:约 10 分钟

Android音视频——相关概念

学习Android音视频里,讲过音视频数据从哪里来,怎么获取,其实无论在哪个平台,图 像、视频最初都 是来自摄像头,而音频最初都是来自麦克风,相较于视频,其实音频是更不易于观察,那么你们知道麦克风是如何采集声音的吗?


许嵩-有何不可


麦克风里面有一层碳膜,非常薄而且十分敏感。声音其实是一种纵波,会压缩空气也会压缩这层碳膜,碳膜在受到挤压时也会发出振动,在碳膜的下方就是一个电极,碳膜在振动的时候会接触电极,接触时间的长短和频率与声波的振动幅度和频率有关,这样就完成了声音信号到电信号的转换。之后再经过放大电路处理,就可以实施后面的采样量化处理了。

1.1 帧率

帻率(Fume Rate)是用于测量显示帧数的量度、所谓的测量单位为每秒显示销数(frames per second,简称 ps)或“赫兹”(Hz)。每秒显示帧数(ts)或者帧率表示图形处理器处理场时每秒能够更新的次数。高顿率可以得到更流畅、更逼真的动画,一般来说,30fps 就是可以接受的,但是将性能提升至 60tp 期可以明显提升交互感和逼真感,但是超过 75fps 就不容易察觉有明显的流畅度提升了。如果城丰超过屏幕刷新率,则只会浪费图像处理能力,因为监视器不能以这么快的速度更新,这样超过刷新率的帧率就浪费掉了。

1.2 分辨率

视频分辨率是指视频成像产品所形成的图像大小或尺寸。

1.3 刷新率

剧新率是指屏幕每秒画面被刷新的次数,刷新率分为垂直刷新率和水平刷新率,一般提到的剧新率通常指垂直刷新率。垂直刷新率表示屏幕上图像每秒重绘多少次,也就是每秒屏幕剧新的次数,以 Hz(赫兹)为单位。刷新率越高,图像就越稳定,图像显示就越自然清晰,对眼睛的影响也越小。刷新率越低,图像闪烁和抖动得就越厉害,眼睛疲劳得就越快。一般来说,如能达到 80Hz 以上的刷新率,就可以完全消除图像闪烁和抖动感,眼睛也不太容易疲惫。

1.4 编码格式

编码的目的是压缩数据量,采用编码算法压缩冗余数据。常用的编码格式有如下这两种 ·MPEG(MPEG-2、MPEG-4)·H26X(H.263、H.264/AVC、H.265/HEVC)

1.5 封装格式

把编码后的音视频数据以一定格式封装到一个容器,封装格式有 MKV、AVI、TS 等。

1.6 码率

码率也就是比特率,比特率是单位时间播放连续的媒体(如压缩后的音频或视频)的比特数量。比特率越高,带宽消耗得越多。比特(bit)就是二进制里面最小的单位,要么是 0,要么是 1。文件大小(b)=码率(b/s)x 时长(s)

1.7 画质与码率

此处提出一个问题,是码率越大,画质越好,视频越流畅吗?这是错误的说法,实际上视频质量和码率、编码算法都有关系。

1.8 DTS 与 PTS

下面分别介绍一下 DTS 和 PTS.·DTS:即 Decode Time Stamp,主要用于标示读入内存中的比特流在什么时候开始送入解码器中进行解码。PTS:即 Presentation Time Stamp,主要用于度量解码后的视频帧什么时候被显示出来。

1.9 YUV 与 RGB

下面分别介绍一下颜色空间模型 YUV 与 RGB。·YUV:是被欧洲电视系统所采用的一种颜色编码方法(属于 PAL),是 PAL 和 SECAM 模拟彩色电视制式采用的颜色空间模型。其中的 Y、U、V 几个字母不是英文单词的首字母,其中 Y 代表亮度,UV 代表色关,U 和 V 是构成颜色的两个分量。RGB:是一种颜色空间模型,通过对红(R)、绿(G)、蓝(B)3 个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色,RGB 即代表红、绿、蓝 3 个通道的颜色。

1.10 视频帧及音频帧

常见的视频帧有 1、P、B 帧等,下面分别进行介绍。·【帧表示关键帧,你可以理解为这一帧画面的完整保留,解码时只需要本帧数据就可以完成(因为包含完整画面)。


·P 帧表示的是这一帧和之前的一个关键帧(或 P 帧)的差别,解码时需要用之前级有画面叠加上本帧定义的差别生成最终而面。(也就是差别帧,P 帧没有完整面数。只有与前一帧的画面差别的数据。) ·B 帧是双向差别帧。也就是 B 帧记录的是本帧与前后帧的差别(具体比较复杂。有 4 通过前后面面数据与本帧数据的叠加取得最终的面而。B 帧压缩率高,但是解码时 CPU 会比较吃力。


精度就可以播放。比如采样率为 44.1kHz,采样精度为 16 位的音频,你可以算出比特率是 4410016kb/s,每秒的音频数据是固定的 4410016/8 字节。AMR 顿比较简单,它规定每 20ms 的音频是 1 帧,每一帧音频都是独立的,有可能来用不同的编码算法以及不同的编码参数。·MP3 帧较复杂一些,包含了更多的信息,比如采样率、比特率等各种参数。具体如下:音频数据帧个数由文件大小和帧长决定,每一帧的长度可能不固定,也可能周定,由比特率决定,每一帧又分为帧头和数据实体两部分,帧头记录了 MP3 的比特率、采样率、版本等信息,每一帧之间相互独立。

1.11 量化精度

量化精度表示可以将模拟信号分成多少个等级,量化精度越高,音乐的声压振幅越接近原音乐。量化精度的单位是 bit(比特)CD 标准的量化精度是 16bit,DVD 标准的量化精度是 24bit。也可理解为一个采样点用多少 bit 表示(8/16/24/32bit)。

1.12 采样率

采样率指每秒音频采样点个数(8 000/44 100Hz),采样率单位用 Hz(赫兹)表示。

1.13 声道

声道(Sound Channel)是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号,所以声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。常见声道有单声道、立体声道、4 声道、5.1 声道、7.1 声道等,下面分别进行介绍。


  • 单声道:设置一个扬声器,这个较为常见。

  • 立体声道:把单声道一个扬声器扩展为左右对称的两个扬声器。声音在承制过程中被分配到两个独立的声道,从而达到了很好的声音定位效果。这种技术在音乐欣赏中显得尤为有用,听众可以清晰地分辨出各种乐器来自何方,从而使音乐更富想象力,更加接近临场感受。立体声技术广泛应用于自 Sound Blaster Pro 以后的大量声卡,成为了影响深远的音频标准。


  • 声道:4 声道环绕规定了 4 个发音点,分别是前左、前右、后左、后右,听众则被包围在中间。同时还建议增加一个低音音箱,以加强对低频信号的回放处理(这也就是如今 4.1 声道音箱系统广泛流行的原因)。就整体效果而官,4 声道系统可以为听众带来来自多个不同方向的声音环绕,可以获得身临各种不同环境的听觉感受,给用户以全新的体验。


  • 5.1 声道:其实 5.1 声道系统来源于 4.1 声道系统,将环绕声道一分为二,分为左环绕和右环绕,中央位置增加重低音效果,如图 1-1 所示。


  • 7.1 声道:7.1 声道系统在 5.1 声道系统的基础上又增加了中左和中右两个发音点。简单来说,就是在听者的周围建立起一套前后相对平衡的声场,增加了后中声场声道,如图 1-2 所示。


1.14 分贝 dB

关于分贝 dB,人们的第一感觉认为是声音的大小单位,如机械厂房中噪声为 90 分贝。dB 真的是单位吗?其实分贝除了用于声学领域之外,在 NVH 测量领域,到处可见分贝。它似乎是一个测量值的单位,通常是纵轴,但实际上它不是一个单位,它是个无量纲。我们经常在声学、振动、电子学、电信、音频工程 &设计等领域见到它。既然它是个无量纲,那我们为什么要用它呢,怎么正确使用它呢?


分贝最初使用是在电信行业,是为了量化长导线传输电报和电话信号时的功率损失而开发出来的。是为了纪念美国电话发明家亚历山大·格雷厄姆·贝尔(Alexander Graham Bell),以他的名字命名的。虽然分贝定义为 1/10 贝尔,但单位“贝尔”(Bel)却很少用。分贝 dB 定义为两个数值的对数比率,这两个数值分别是测量值和参考值(也称为基准值)。存在两种定义情况。一种为功率之比:



一种为幅值之比:



简单的说就是量度两个相同单位之数量比例的计量单位,大家知道这个就好,更深的可以去查看相关资料。

发布于: 刚刚阅读数: 3
用户头像

程思扬

关注

会的越多,不会的越多 2022.01.03 加入

还未添加个人简介

评论

发布
暂无评论
Android音视频——相关概念_音视频_程思扬_InfoQ写作社区