写点什么

音频

0 人感兴趣 · 23 次引用

  • 最新
  • 推荐

AI 音乐创作,让每一个人都成为音乐家

用户头像
HMS Core
2022-11-14

从录音带、MP3到专业的耳机、音箱,随着音乐消费方式的不断升级,音乐创作的专业“门槛”也在AI技术的加持下逐渐大众化,创作者的创新设计、创作频率也在持续增强,能降低创作门槛且智能化的创作工具就显得尤为重要。

再谈回声消除测评丨 Dev for Dev 专栏

用户头像
声网
2022-08-26

音频质量的优化是一个复杂的系统工程,回声消除是其中一个老生常谈的话题,一般来说,回声消除的效果受设备本身的声学设计、声学环境、以及软件系统等诸多因素的影响。

https://static001.geekbang.org/infoq/0b/0bb5de67347dcd8398b8a9375146180b.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

音频技术的下一个“热点”,会出现在哪个领域?丨一期一会 • 音频工程师专场

用户头像
声网
2022-08-22

在语音识别重建、音效声场重现、数字音频通信等方面,积累了很多自己的音频技术专家和学者,已经逐步缩小和西方的技术差距。

https://static001.geekbang.org/infoq/34/3424873ee6fa1de7c7243f8e5e180710.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Any to Any 实时变声的实现与落地丨 RTC Dev Meetup

用户头像
声网
2022-06-20

本文基于声网音频体验算法专家冯建元在活动中分享内容整理。

https://static001.geekbang.org/infoq/8e/8ee83290bc4b94dfe007d429bcec9c2f.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AliAGC 自动增益控制算法:解决复杂场景下的音量问题

音视频会议,直播连麦以及短视频已经成为人们工作、教学以及娱乐的一部分,其背后都离不开音视频实时通信等关键技术的广泛应用。音频方面,可预见的是客户业务形式的多样性,环境的复杂性,以及接入设备的差异性会带来的一系列问题,我们意识到单一场景的技术

https://static001.geekbang.org/infoq/72/72dcb39dd6bf451e357cabde30d2b4ce.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AliIAC 智能音频编解码器:在有限带宽条件下带来更高质量的音频通话体验

随着信息技术的发展,人们对实时通信的需求不断增加,并逐渐成为工作生活中不可或缺的一部分。每年海量的音视频通话分钟数对互联网基础设施提出了巨大的挑战。尽管目前全球的互联网用户绝大多数均处于良好的网络状况,但仍有不少地区处于极差的网络条件下,除

https://static001.geekbang.org/infoq/48/4893a5da57ca883adaab48868a3252ad.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AliPLC 智能丢包补偿算法, 提升弱网环境的通话质量

在线视频/语音通话逐渐成为人们日常生活的一部分,而复杂多变的网络环境会导致部分音频包无法传送到接收端,造成语音信号的短时中断或者卡顿,这会严重影响通话体验,为解决这类问题,阿里云视频云音频技术团队在综合考虑效果、性能开销、实时性等诸多因素后

https://static001.geekbang.org/infoq/52/528a967709fe3f0e282ab5271d876a37.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

语音顶会 ICASSP 2022 成果分享:基于时频感知域模型的单通道语音增强算法

近日,阿里云视频云音频技术团队与新加坡国立大学李海洲教授团队合作论文 《基于时频感知域模型的单通道语音增强算法 》(Time-Frequency Attention for Monaural Speech Enhancement ) 被 ICASSP 2022 接收, 并受邀于今年 5 月在会议上向学术和工业界做研究报

教你一个快速视频处理的神器:Python moviepy

python 中的视频处理模块,有一个叫做 moviepy,今天我们就来唠唠它。

使用 scipy.fft 进行 Fourier Transform:Python 信号处理

摘要:Fourier transform 是一个强大的概念,用于各种领域,从纯数学到音频工程甚至金融。

https://static001.geekbang.org/infoq/61/61f4bfb7bbb415a92b66866198c0a583.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

浅谈语音质量保障:如何测试 RTC 中的音频质量?

日常音视频开会中我们或多或少会遭遇这些场景:“喂喂喂,可以听到我说话吗?我听你的声音断断续续的”,“咦,我怎么可以听到回声?”,“太吵啦,我听不清楚你在说啥” 等等。这些语音质量问题影响音视频开会体验,如若是重要的会议,那足够让人 “恼羞成怒

你真的懂语音特征吗?

​​摘要:本文旨在详细介绍语音转化声学特征的过程,并详细介绍不同声学特征在不同模型中的应用。

https://static001.geekbang.org/infoq/2e/2e9140a6f0c3d0b717b5f4254cce2698.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

云信技术系列课 | RTC 系统音频弱网对抗技术发展与实践

用户头像
网易云信
2021-04-28

本文整理自线上直播【MCtalk Live#2 :RTC 系统音频弱网对抗技术发展与实践】网易云信资深音视频引擎开发专家崔承宗分享内容,文末也可查看直播回顾视频。

一种自适应混合域音频无声水印

用户头像
行者AI
2021-04-27

随着数字音频技术的不断发展,音乐版权问题受到重视。用于音频版权保护的技术得到越来越多的研究与关注,无声水印技术就是其中之一。同时互联网在线会议越来越受到欢迎,音频无声水印技术也可以在保证会议的保密性的同时追踪泄密源头。

https://static001.geekbang.org/infoq/cc/cc75738379817fb891a62e8d0c2b07ed.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

RTC 技术干货 | 音频质量评价体系那些事

用户头像
拍乐云Pano
2021-04-01

好的音视频体验,将是决定产品成功与否的最重要因素之一。本篇技术分享将带你了解实时音频质量的主客观评估标准。

INTERSPEECH2020 语音情感分析论文之我见

​​摘要: 本文为大家带来InterSpeech2020 语音情感分析25篇论文中的其中8篇的总结。

https://static001.geekbang.org/infoq/cf/cf02f2431d5919e1a0b273e32d63270d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

markdown 如何插入图片、音频、视频?

用户头像
xiezhr
2021-03-15

Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档。今天呢我们就要学习下markdown如何插入图片、音频、视频

音乐信息检索:理性解构音乐

前几天小伙伴们是不是都被魔性的「蚂蚁呀嘿」刷屏了?其实背后的技术含量并不复杂,主要依靠的是换脸技术和自动节奏检测,算法会找到节奏点,在这些节奏点摇脸换表情,这样一支魔性而上头短视频就诞生了。今天为大家一一解构那些网络神曲,分享音乐信息检索算

https://static001.geekbang.org/infoq/ed/eda687874e0aa8746122dc2f085029a2.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

如何实现在直播中播放音频文件

用户头像
anyRTC开发者
2021-03-03

在我们看直播的时候,经常会在直播过程中听到有掌声、口哨声、背景音乐等音效,那么这些声音特效是如何实现的呢大家有没有想过?anyRTC下面就为大家简单介绍一下如何实现在直播过程中播放音频文件。

https://static001.geekbang.org/infoq/1f/1f5588ed2da2d601f25598cf4679da1d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

浅谈 WebRTC 的 Audio 在进入 Encoder 之前的处理流程

在 WebRTC 中,Audio 数据在被送入编码器之前,有 2 大部分需要特别关注,一是数据采集,二是 Audio Processing。

https://static001.geekbang.org/infoq/26/2643381b6cec278803bbb65a0d77a7a3.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

倍频程与钢琴调式的距离

单从倍频程和钢琴调式这两个名词看,距离确实有点远,一个偏科技一个偏娱乐。但是距离远不代表没有关系,下面就让我们给它们俩拉拉关系吧。

音频_音频技术文章_InfoQ写作社区