拍乐云 x 扬帆出海 x LiveCloud:音视频出海专家干货分享
拍乐云携手扬帆出海和 LiveCloud 于 3 月 30 日晚 举办了“音视频出海新风口 02 期”线上公开课活动,聚焦目前非常火热的音视频社交 App 出海赛道。
本次扬帆出海线上公开课,Live Fun Group COO Sandy 和拍乐云 Pano 首席音频专家 Ark 两位社交出海专家,围绕“精准把握海外用户需求,打造产品的沉浸式体验感”等产品话题,为大家提供包括出海音视频赛道选择和市场定位、出海音视频技术的难点和解决思路等相关内容分享。
下面是扬帆出海根据本次活动两位嘉宾的分享整理的干货内容:
Live Fun Group COO Sandy:出海社交产品 赛道选择及定位策略
Live Fun Group 从 2019 年 4 月成立至今,已经开发近 10 款产品,包括短视频 App、1 对 1 陌生交友直播、秀场直播等,用户遍布东南亚及欧美。
团队成员来自于美国硅谷、中国香港及国内大厂,熟悉海外市场用户增长,曾经一个月在菲律宾零成本获取一百万用户。Live Fun Group COO Sandy 从“海外社交市场有多大? 现在进场,还有机会吗? 需要准备什么?”这三个问题入手,分享了海外社交产品,如何选择赛道和进行产品定位。
01 海外社交市场有多大?
大家选择出海社交这个赛道,首先会思考第一个问题,海外社交市场到底多大?据网上统计来说有 10 亿的用户量,5 亿的美金月流水。但是在很多社交产品里面其实有三方支付未被统计。据我了解有一些产品三方支付收入都达到 50%以上。这样算下来 5 亿美金月流水绝对是低估了这个市场。
02 现在进场,还有机会吗?
第二个问题,现在进场还有机会吗?我可以非常肯定坚定的告诉你,非常有机会,社交风口是一直存在。海外最早做欧美社交产品的是 Match Group,他们从 1993 年开始做网上的网页端交友平台,过渡到现在他们已经拥有 20 多款社交 APP,不同垂直领域,不同的玩法都会有。Match Group 主要的渗透区域是欧美,而印度、中东,甚至非洲这些国家其实还有待开发。
03 需要准备什么?
第三个问题,假如说你现在真的准备做社交出海,具体准备什么?
主要是这三个点:
1、产品技术。做一个社交产品出来,前提是产品的技术架构,像今天拍乐云这套 PaaS 系统,接入了直接就可以快速打造出一款社交产品。
2、内容运营。比如主播,需要搞定内容产出。
3、投放。投放到市场,让用户触达到你这款产品。出海社交赛道粗略来说有 4 种产品形态:秀场直播、语音房、1 对 1 视频、1 对 1 语音。
下面将聊到区域市场定位及不同市场用户特征。篇幅所限,举两个区域欧美和中东。
欧美四个关键词,第一个开放,欧美互联网文化崇尚自由。第二点就是用户更习惯直截了当,了解自己的需求是什么?所以最好在做这种产品的时候,让他尽快找到他想要的东西,那就对了。第三点,注重隐私。他们更偏好选择匿名登录。第四点,付费意愿非常强。基本上我们投放下来,我做过欧美、中东、印度,算下来他的付费转化,平均付费值都是偏高,平均付费额可以高达 15 美金。
再一个中东,中东人无疑非常保守,阿拉伯区域,因为他们是穆斯林国家。女性上街都是佩戴头纱,你们可以搜一下宗教警察这四个字,微信上搜就可以,有一些产品因此被下架一些新闻。
再来就是非常付费大方,大方体验在数值上面,中东这个地区他们厉害在非常多的土豪爸爸,几千个土豪爸爸养好了就可以了。他们做语音房,一万下载能够做到月 50 万美金的收入。大方这个不用再证明了。
第三点,社交需求非常强。可以看到 Yalla 他们下一步有更多的社交产品会在中东落地,例如下图中右下角倒数第二款的一款 1 对 1 语音产品。还有很多入场中东的厂商都是做语聊房,其他产品方面还是可以去想象。
所以,我建议你们在选择产品或者国家去做的时候,假如你是小白,不妨选择一些便宜或者容易做的产品先去实验,产品存活下来再进一步进行产品的迭代。
选择好区域之后,就是如何做产品的本地化,那么本地化主要涉及哪些方面呢?
第一个是登录,登录国内产品都是用微信或者手机号登录,做海外的时候,需要考虑当地登录习惯,他们会用苹果、脸书、谷歌登录等等。假如说你做熟人关系链,秀场直播希望引入更多熟人关系链进去,你可以考虑利用本身熟人关系链引进。假如说你做 1 对 1 产品,用户不太希望让别人知道,你务必考虑匿名登录设置。
第二个是语言,进入一个市场,假如他在国内本身做一款产品,去到海外可不可以直接翻译成英文进去,我觉得可以。但是问题是你如果进入的是一些小的国家,假如像是越南,或者西班牙语区这些地方,建议你要先考量自己做哪个市场?然后判断自己直接做英文,或者本地化语言更加好。
再一个是内容,这五点里面最重要的。当用户进到你的产品,他其实偏好性还是希望看到自己本国,假如你是秀场,或者语聊房,用户沟通媒介看不到脸,必须是语言的话,那么语言必须互通。当地主播提供这些内容,用户和主播之间才能良好沟通,你才可以促使用户愿意付费,支持这个主播。如果你做到后期相对成熟的话,可以考虑加入不同版,然后设置一个 VIP。做社交产品,或者 1 对 1 产品来说,男生还是花心,他们还是希望有多个国家的女性选择可以聊天,可以做成 VIP 设置,然后选择跟其他国家聊天。
下一个是支付,支付方面首先你其实无论做苹果或者安卓,他们本身有自己官方支付,基本上解决 80%-90%的问题,因为很多用户有付费能力,他一定会绑定商店信用卡进行支付。为什么加入三方支付,就是考量到部分地区,用户信用卡普及度不高,他们更习惯自己电子钱包。三方支付是被平台排斥的,所以大家加入三方支付的时候,需要考量下架风险。
最后一个是活动,活动方面其实 1 对 1 产品需求不是很高,但是如果是秀场或者语音房,就可以增添用户互动性。你可以看到这个秀场在情人节、圣诞节、复活节等节日做一些活动,联动和组织主播做一些主题性活动,让用户上来跟主播交流。中东地区一些活动,就像对战,他们甚至会联动他们十几个国家主播然后做对战,吸引不同国家的粉丝去做打赏,刺激用户支持自己主播,最后还是平台本身自己获利。说完以上几点,其实大家基本应该想好自己要做什么产品,进去做的时候,应该怎么防范,或者怎么准备。但是如果你们有一些部分解决不了的话,大家可以找我们交流。这也是最近我们公司除了做产品以外,最新提供一些服务支持。
拍乐云 Pano 首席音频专家 Ark:泛娱乐出海潮流背后的音视频技术支撑
拍乐云首席专家 Ark 主要是围绕底层技术聊聊泛娱乐产品背后音视频的要点和难点,以及拍乐云如何给做音视频社交产品的创业者赋能,帮助大家快速打造一个低时延、高流畅、高品质的用户体验。
我在介绍今天的话题之前,先介绍一下我们公司和团队,拍乐云是一家做音视频云服务的 PaaS 平台公司,我们提供端到端的音视频云服务。大家可能对 Zoom 这个软件比较了解,在疫情期间它在全球资本市场非常火。我们的核心团队主要来自视频会议市占率 No.1 的 Cisco WebEx,与 Zoom 团队基因相同,团队汇聚了视频、音频、网络等领域顶级专家。我今天主要给大家讲一讲泛娱乐出海潮流背后的音视频技术支撑。讲技术比较晦涩,我们先从耳熟能详的产品切进来,聊聊音视频社交产品的共性以及技术挑战。
Clubhouse 背后出海机会的思考
首先给大家介绍一下 Clubhouse,这一款软件无论资本市场还是用户流传度都是非常火爆的。是什么让一款纯音频社交如此火爆?我对此做了一些整理和思考,跟大家做个分享。
总结海外线上泛娱乐产品的两个特点,第一个功能简单,第二个多人交互,刚才 Sandy 说的海外 1 对 1,可以搜出几千款,而未来多人社交的潜力更大。
音视频产品创新及技术攻克 拍乐云如何赋能创业者出海
接下来,聊一下音视频技术,这是我们自己的架构图,功能比较全面,具有一定的代表性和典型性。首先我们有多端的 SDK 和我们的媒体服务器,两者构建在一起,实现实时交互。另外,我们有全网的智能调度体系等等,这也是我们做好音视频底层服务需要具备的模块。
了解到音视频的技术架构以后,我想再说一下,对于底层技术来说,想做到沉浸式体验是非常有挑战的,音频、视频都如此。
我觉得有三个比较重要的难点:一是设备适配,二是特殊玩法的技术挑战,三是网络条件的复杂性。
为什么要手机适配呢?音视频,特别是音频的质量和硬件能力有非常大的关系,不同厂商采购的海量不同硬件与不同的系统层处理,和我们希望为用户提供的一致性音视频服务之间有较大的差异。比如有的手机麦克风噪音很大,有的扬声器在大音量下失真严重,还有的手机的系统前后处理会出现一些 BUG、能力不能统一等等,用起来不是很好。
再聊一聊泛娱乐产品的玩法场景,包括 1 对 1 视频、1 对 1 语音、秀场直播和语音聊天室。近几年国内也探索出现了不少新鲜的多人玩法,比如说一起听、一起看,在线 KTV,还有实时竞猜。在国外市场,也是值得去试一试的新一轮机会点。
泛娱乐创新场景下想做更好的音视频互动体验是有门槛的。就拿在线 KTV 这个场景来说,对于时延的要求非常高,特别是当主播和连麦者一起合唱一首歌时,主播的声音、背景音乐和连麦合唱者的声音需要是同步的。在线下 KTV 场景中,这三个声音都是在同空间下产生并传输的,所以并不存在时延对齐的问题。但线上的 KTV 场景会有传输时延问题,主播和连麦者不是同时刻听到背景声音,主播听到连麦者的声音总是会经过一个端到端的时延。就目前业界的设备和网络情况来看,RTC 很难把时延做到能在音乐场景下能有统一的完美解决方案的,目前大家的方案都是有所取舍。
下面来介绍两种方案:
1. 放弃主播听其他连麦者的唱歌方案,服务器或者主播本地声音播放后,主播的声音和对齐后的背景音乐进行混音,再经过网络传输给连麦人员,连麦人员听到主播和背景音乐声音是对齐的,连麦人员再唱歌和主播和背景音乐基本对齐,但是主播听不到连麦者,这样放弃了主播听连麦的体验,在网络时延较大的时候,依然可以让连麦者和观众都能有很好的体验。
2.主播和连麦者基于同一时刻的背景音乐唱歌,在服务器下载好背景音乐后,由消息沟通同步播放时间,基本保障主播和连麦者是同一时刻听到背景音乐,两个声音传输到服务器再转发到对端,另外再转发一份到直播推流服务器,这个方案的好处是,主播和连麦者还是有互动的,观众侧听到声音也基本是对齐的,主播和连麦者听对端的声音都有时延,RTC 时延越短体验越好。
第三个痛点是网络条件的复杂性。我们思考下怎样才算好的线上音视频体验,我认为这三点很关键:
首先时延。超过 300 毫秒时延就可以达到人体可以感知,超过 500 毫秒通话就没有那么顺畅了,可明显感知到有交互上距离感。二是,是不是足够高保真、足够清晰、没有其他的干扰。还有平顺性,音频语义是否完整、视频是不是流畅。真正想把沉浸式体验做好,这三点缺一不可。
在这三点前提下,我们还需要做弱网优化,主要分两个方面:一个在硬件层,一个在软件层,硬件层每一家都有不同的技术,大多数都是从基建上来着手。
软件层其实各家也是不同的策略,包含前向纠错 FEC、丢包重传 ARQ、RED 等技术,除此之外拍乐云在应对思路上,更加专注于传输效率。
另外想分享的一点是,国内很多厂商是非常注重丢包率的,但是海外却反而不是。举个例子,谷歌 webrtc 和 ZOOM 并没有可以处理较大丢包的能力(例如丢包率 50%以上),因为他们不认为线上有太多丢包场景。国内的很多音视频 PAAS 厂商对于极高丢包的抵抗都有很大的宣传。有人觉得是国内外的技术理解不一样,也有人觉得是国内外的网络环境不一样,所以优化目标不一样,而所有的技术方案还是要靠终端用户体验来评价的。
拍乐云当然也有自己的理解,抗丢包本身并不是特别复杂的技术,但是任何的抗丢包技术都会有一些代价,基于质量-平顺性-时延的综合体验,同时我们也认为实际场景中丢包会伴随着一定的带宽受限,所以只低效的追求抗丢包而无视时延和质量的损失并不是我们追求的目标,相反在单位带宽下做出平衡三者的极致传输效率的方案才是我们追求的目标。综合国内和国外的做法加上我们的思考,拍乐云目前的处理方案可以兼容比较高的丢包的情况下我们只用 160kbps 的音频带宽,而最低总带宽在 60kbps 的情况下音频依然可以正常的顺畅传输,时延最短可以到 60 毫秒。
最后说一下,我们也有自己的语音聊天室演示 Demo 和开源代码,我们的 API 还有更多的功能,比如耳返、伴音、变声、美声、立体声等,欢迎大家到我们官网体验。拍乐云的使命是希望可以用我们的音视频技术构建云上的每一次美好互动。谢谢大家!
版权声明: 本文为 InfoQ 作者【拍乐云Pano】的原创文章。
原文链接:【http://xie.infoq.cn/article/22e963fee9a1de35311cf9ad5】。文章转载请联系作者。
评论