音视频全链路开发实践｜引航计划｜音视频

2021 年 10 月 07 日
本文字数：1877 字
阅读完需：约 6 分钟

作者：老猿 Python

本文介绍了 Python Moviepy 音视频剪辑库的安装、主要功能以及部分示例代码，可以看到 Moviepy 能从文件或音视频流中装载音视频剪辑，并对装载的音视频剪辑进行各种变换和合成，代码开发简单易懂，很容易掌握，感兴趣的朋友不妨尝试一下。

Moviepy 音视频剪辑：黑白视频的帧图像格式探究

作者：老猿 Python

本文通过介绍将视频帧转换为灰度图像，再构建黑白视频的处理过程所遇到的问题及解决办法，确认了无论是从输入黑白视频的像素值还是将黑白视频输出到视频文件的处理过程来看，黑白视频的帧图像不是二维的灰度图，而是对应三维的彩色图像格式，其像素值为 RGB 三元组格式，只是 R、G、B 三个分量的值都是为对应灰度图的灰度值。

基于 OpenCV+QT 开发超实用的视频编辑器

作者：轻口味

本文基于 OpenCV+QT 开发一款带 UI 界面的视频编辑工具。在满足我们功能的基础上，充分了解和学习 opencv 及 QT 技术。

两个剪辑透明化融合视频特效处理

作者：老猿 Python

介绍了通过 moviepymask 遮罩或 OpenCV 图像融合实现两个剪辑的叠加融合，实现了上层剪辑背景色部分不遮挡下层剪辑内容的效果。通过实现案例的介绍，可以理解遮罩剪辑和 OpenCV 图像运算的作用，并在视频特效制作中使用相关方法。

使用 Python 实现视频 Logo 消除处理

作者：老猿 Python

本文详细介绍了消除视频 Logo 图标的几种方法以及涉及的背景知识，并提供了一套 Python+Moviepy+OpenCV 实现的消除视频 Logo 的代码。通过本文，可以了解视频剪辑处理结合 OpenCV 图像融合操作的相关知识。

OpenCV-Python+Moviepy 结合进行视频特效处理

作者：老猿 Python

本文介绍了制作视频雪花飘落特效和灯光秀的原理、实现的思想以及流程，并利用 Python+OpenCV+Moviepy 提供了关键的实现代码，可以供大家理解图像融合、图像制作视频、Moviepy 视频变换的完整案例。

WebRTC 是如何设置视频编码偏好的？

作者：liuzhen007

文揭秘 WebRTC 在通信过程中的码率、帧率控制的实现逻辑，对刚刚接触 WebRTC 的同学遇到这样的问题进行了解惑。

WebRTC 的本地视频预览播放器

作者：liuzhen007

本文介绍了本地预览的视频播放器，包括打开摄像头，显示播放器的控制按钮，以及拍照、保存照片、贴图、视频特效等辅助功能。

WebRTC 如何在网页端添加硬水印

作者：liuzhen007

本文介绍了 WebRTC 场景中的水印添加方案。播放器展示的视频水印分为软水印和硬水印两种，水印的作用一方面是用来增加视频画面的展示内容，比如广告效果、特效处理等；另一方面是出于版权保护的目的，防止视频盗录的风险。

音视频编解码 --X264 码率控制初探

作者：Fenngton

本文介绍了比特率概念，X264 码率控制原理，码率控制基本函数，X264 码率控制参数等。

实时语音如何过质量关？

作者：cv 君

本文介绍了过去几年和近今年语音传输，语音编解码前后的质量问题，另外还针对几种噪声，提出了解决的方案，以便我们更好地解决问题。

浅谈实时语音质量监控系统

作者：攻城先森

在过去的语音通信系统中，影响语音质量的因素有很多，包括但不仅限于延时(delay)、丢包(packet loss)、包延迟变化(packet delay variation)、回声(echo)、以及由于编码造成的失真。本文介绍了语音质量评估方法的三种主要方法：有参考客观评价方法、主观评价方法和无参考客观评价方法、有参考客观评价方法

聆听极致 ——声网 Agora

作者：cv 君

本文介绍了声网 Agora 的实时通话 SDK 的能力和接口。

【AI 全栈二】视频流多目标多类别无延迟高精度高召回目标追踪

作者：cv 君

本文介绍了视频流多目标多类别无延迟高精度高召回目标追踪的原理及代码实现。

【AI 全栈 SOTA 综述】这些你都不知道，怎么敢说会 AI？【语音识别原理 + 实战】

作者：cv 君

本文介绍了语音识别技术原理与实现。

漫游语音识别技术——带你走进语音识别技术的世界

作者：攻城先森

本文带大家漫游一下当下发展火热的语音识别技术，通俗易懂、干货满满！

（深入篇）漫游语音识别技术—带你走进语音识别技术的世界

作者：攻城先森

本文主要讲述了语音信号识别过程，降噪及预处理技术，并分析了特征识别的框架和重要知识点。

（实战篇）漫游语音识别技术—带你走进语音识别技术的世界

作者：攻城先森

本文基于当今主流四种声学模型，结合深度学习算法，实战演练语音信号识别过程及模型搭建；语音识别在语音聊天、音乐社交、视频直播，这些与“声音”有关的社交场景中应用越来越广的背景下，还会出现哪些问题呢，其中最突出的问题就是现有的语音内容审核+实时音视频服务，部署、调试、运维的成本高，由此推荐讲解了 Agora 一站式智能语音识别方案，总结了语音识别开发工具和相关开源学习资料。