腾讯会议增长背后的技术实践
10.5 个人开发的一款产品 ,在正式上线两个月后,其日活用户就超过 1000 万。不到一年,它的注册用户就突破 1 亿。并且,其国际版在全球超 100 个国家和地区上线。过去一年,它支撑了 3 亿场会议。这是腾讯会议正式发布一年来取得的成绩。
2019 年 12 月 25 日,腾讯云发布一款云视频会议产品,即腾讯会议,它致力于提升跨企业、跨区域沟通和协作效率,帮助企业节省人力、时间等成本。用户可以直接通过手机、电脑、小程序等入口打开即用,一键入会。
2019 年 12 月 25 日,腾讯会议正式对外发布,团队当时定了一个小目标:希望在 2020 年底,腾讯会议的 DAU(日活跃用户)可以达到 5 万。如果在 2020 年底实现 5 万 DAU 的目标,“我们觉得这就是我们今年最好的成绩”。上线两个月,DAU 破 1000 万。
在腾讯会议发布近 1 个月后,武汉封城,疫情形势日益严峻。腾讯会议在短时间内迎来海量用户的快速增长。2 月初,腾讯会议迎来巨大考验。它的系统最初是为 5 万 DAU 目标设计的,但是,在不到两个月的时间,腾讯会议的 DAU 突然翻了几百倍。
为了应对系统压力,腾讯同事们“白天,做大量的扩容,保障带宽资源、服务器资源等;夜里,针对产品性能等问题做大量的开发、部署;凌晨,我们再对当天的所有变更、代码优化做压力测试”。8 天后,扩容 10 万台云主机,累计有超百万核的计算资源投入。
设备虽然得到扩容,业务层面还有大量的细节需要优化和解决。扩容前,业务层只是一个几十台设备的集群系统,系统的管理和调度系统都比较简单。扩容后,突然变成一个多地域,设备数达 10 万级的集群,原有的调度和管理系统完全无法支撑这么大的规模,需要快速优化和局部重构。
因此,这就需要他们做很多事,比如入口路径规划等等,调度系统的优化外,还要梳理所有模块的调用关系,明确系统的核心路径,尽量简化核心路径,减少和取消核心路径的外部依赖。对于存储层,腾讯建立了一套分布式的压测系统,每天凌晨进行压力测试,从压测中发现系统的瓶颈点,再快速的优化和改进。通过每日压测,系统的同时在线服务能力逐渐从 100 多万上升到 500 万、800 万在线。在人力方面,向腾讯云求助,腾讯云兄弟部门则派了四五个团队过来协助。
245 天,注册用户破 1 亿
在疫情得到控制后,腾讯会议的第一要务从稳定变成了功能和服务质量。
第一,在音视频的核心体验上,降噪与延时下功夫。在场景上下功夫,诸如添加虚拟背景。
第二,在接入方面,他们建立分级的数据中心,完善后台管理体系和调度系统,调度用户就近接入和数据流闭环。
第三,在部署和运营上,他们从预发布、灰度 Set 到普通 Set 再到 VIP Set 形成一套完整的流程和体系。新版本正式上线前会有预发布,通过自动化拨测检测系统的质量和可用性。然后,进入灰度 Set 阶段,基于后台管理体系评估灰度版本的质量,减少系统发布异常的影响范围。经过灰度 Set 验证的版本,在普通 Set 开始部署和放量。最后是 VIP Set,在普通 Set 验证系统和功能的稳定性后,逐步部署到 VIP Set 中。此外,他们还进行了流量优化、提升通信质量,等等。
在这一系列的优化之后,仅仅是腾讯会议正式发布 245 天后,其注册用户正式突破 1 亿,速度不可谓不快。
本文完
本文为《从 DAU 5 万到用户数破亿,揭秘腾讯会议增长背后的技术实践》概述版,欢迎阅读原文(https://mp.weixin.qq.com/s/Yf2pHXKwUjsLJ6J2wlnrOA)。
评论