写点什么

语音

0 人感兴趣 · 26 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/72/72dcb39dd6bf451e357cabde30d2b4ce.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AliIAC 智能音频编解码器:在有限带宽条件下带来更高质量的音频通话体验

随着信息技术的发展,人们对实时通信的需求不断增加,并逐渐成为工作生活中不可或缺的一部分。每年海量的音视频通话分钟数对互联网基础设施提出了巨大的挑战。尽管目前全球的互联网用户绝大多数均处于良好的网络状况,但仍有不少地区处于极差的网络条件下,除

解析 WeNet 云端推理部署代码

摘要:WeNet是一款开源端到端ASR工具包,它与ESPnet等开源语音项目相比,最大的优势在于提供了从训练到部署的一整套工具链,使ASR服务的工业落地更加简单。

带你了解 3 类预训练语音模型预测方法

摘要:在调研多篇论文后,笔者发现预训练语音模型的预测方法基本可以分为以下3类:<1>用前文预测当前及后文(自回归)<2> 随机mask 一些帧并预测 <3> 用两侧上下文预测中间帧。

https://static001.geekbang.org/infoq/b9/b907d81448b573568aefb14ba5e042ef.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

一文读懂「TTS 语音合成技术」

用户头像
澳鹏Appen
2021-10-20

人机交互越来越广泛地应用在我们的生活中,离不开语音合成技术的与时俱进。

https://static001.geekbang.org/infoq/61/61f4bfb7bbb415a92b66866198c0a583.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

浅谈语音质量保障:如何测试 RTC 中的音频质量?

日常音视频开会中我们或多或少会遭遇这些场景:“喂喂喂,可以听到我说话吗?我听你的声音断断续续的”,“咦,我怎么可以听到回声?”,“太吵啦,我听不清楚你在说啥” 等等。这些语音质量问题影响音视频开会体验,如若是重要的会议,那足够让人 “恼羞成怒

https://static001.geekbang.org/infoq/ba/baf121e64e16ea795adaa41eb28b6faa.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于语音情感识别的应用和挑战,详解华为云的语音情感识别方案

摘要:本文介绍了语音情感识别领域的发展现状,挑战,重点介绍了处理标注数据缺乏的问题。

智能语音技术:从哪儿来?往何处去?

近几年,语音识别技术逐渐走向成熟,越来越多的互联网公司及硬件厂商在布局智能语音的商业版图。万物互联的浪潮势不可挡,智能语音技术在汽车、智能家居、教育等各个领域全面开花。

你真的懂语音特征吗?

​​摘要:本文旨在详细介绍语音转化声学特征的过程,并详细介绍不同声学特征在不同模型中的应用。

基于 RNN 和 CTC 的语音识别模型,探索语境偏移解决之道

​​​​​​​​摘要:在本文介绍的工作中,我们展示了一个基于RNN和CTC的语音识别模型,在这个模型中,基于WFST的解码能够有效地融合词典和语言模型。

超清音质实时会议系统的背后 ,深入剖析 AliCloudDenoise 语音增强算法

近些年,随着实时通信技术的发展,在线会议逐渐成为人们工作中不可或缺的重要办公工具,据不完全统计,线上会议中约有 75% 为纯语音会议,即无需开启摄像头和屏幕共享功能,此时会议中的语音质量和清晰度对线上会议的体验便至关重要。

https://static001.geekbang.org/infoq/2c/2c7512af8a9f42ade3f2a4b00f1bef35.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

为什么要做语音聊天室

用户头像
anyRTC开发者
2021-06-03

语音聊天室覆盖社交、娱乐、直播、电商等多种泛互联网行业应用场景。语音聊天室可按需搭建直播系统,尤其是语音直播,是当下比较流行的直播产品,语音直播与其他直播不同点在于语音直播是通过声音传递,而无需出现在画面里,并且听众也不需要占用时间,可以边

探索语言交互技术在政务数字化的应用

摘要:在智慧城市的建设中,政府也希望能够使用新技术来提供更好的服务。

https://static001.geekbang.org/infoq/89/89fdfe5d75aa996b847e5c32fbbc64f4.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

《Among Us》火爆全球,实时语音助力派对游戏开启第二春

用户头像
ZEGO即构
2020-11-04

太空狼人杀火了,下一个爆发的社交派对游戏会是谁呢?我们拭目以待~

音视频社交的应用和优势

用户头像
anyRTC开发者
2020-11-04

随着5G的来临,传输更高速、资费更便宜、耗电发热更低,会彻底改变即时通讯的“带宽”,带来高可靠超低延时的通讯体验。这让视频这种社交媒介有了具备普及的基础要求。也给超高清视频和虚拟现实技术的应用铺平了道路。音视频社交,也就是基于音视频展开的实时

狼人杀背后的秘密,实时语音你不知道的那些事

用户头像
anyRTC开发者
2020-10-29

狼人杀这个游戏已经在年轻人这个群体中风靡已久了,从线下火到了线上,目前线上狼人杀的app也是百花齐放收获了一大批忠实的用户。

ARChatRoom 功能介绍手册

用户头像
anyRTC开发者
2020-09-28

随着音视频行业的不断发展,从语音聊天,语音通话等软件逐渐衍生出了语音开黑,聊天房,和类似狼人杀这种语音类游戏。因为操作简单,受众面广,所以收到了很多人的喜欢。

anyRTC 无人机图传方案

用户头像
anyRTC开发者
2020-09-23

近年来,随着无人机的发展,无人机巡检在各个领域输中也迅速普及,通过无人机巡检航线规划、数据采集、结果分析处理的全过程自主化、智能化和标准化作业,

https://static001.geekbang.org/infoq/67/6740e232743031a2a3a55e41316863d0.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

anyRTC 云端录制功能上线

用户头像
anyRTC开发者
2020-09-22

云端录制,是 anyRTC针对音视频通话、直播研发的录制组件,与 anyRTC SDK 兼容,通过简单的操作方法,帮助开发者集成录制服务,实现一对一、一对多的音视频通话或直播的录制。

anyRTC - 模仿微信音视频通话功能

用户头像
anyRTC开发者
2020-09-09

呼叫邀请的场景既然这么多,那市面上的这种场景是怎么做的呢?下面我们就来分析一下吧。

https://static001.geekbang.org/infoq/3c/3cbeb9c9c91b10ce5980edb31a29db7f.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

anyRTC 小程序 SDK 4.0 上线

用户头像
anyRTC开发者
2020-09-09

anyRTC 4.0 SDK 自6月份上线以来,已经有上百家老用户迁移至新平台,为了满足使用小程序和终端互动的用户,anyRTC在近日隆重上线了4.0 小程序SDK,该版本性能上比3.0有了质的改变。

anyRTC Native 4.1.0.1 与 Web SDK 4.0.11 上线

用户头像
anyRTC开发者
2020-09-01

anyRTC Native 4.1.0.1与Web SDK 4.0.11已于今日正式上线,新版本采用全新的系统架构和智能感知编码传输技术

漫画通信:有了它,终于可以放心买买买了

神算李开始试水自营电商,但是频繁接到用户投诉,说个人信息遭受泄露!神算李十分疑惑:客户信息究竟在哪个环节泄露的?怎么能保障客户信息安全呢?且看阿里云通信隐私面单锦囊妙计如何为他答疑解惑。

一文读懂阿里云通信的产品体系、技术架构与智能化应用场景实践

在企业使用云通信的过程中,依旧会面临到技术门槛高、系统维护治理难、业务场景适配挑战大等问题,阿里云通信是如何围绕用户需求,打造场景化产品服务体系,面向用户构建安全、易用、稳定、智能的技术系统,用AI能力赋能企业降本提效?

语音_语音技术文章_InfoQ写作社区