即构 SDK 新增焦点语音功能,可实现特定用户语音的聚焦
2021 年,即构 SDK 每月迭代如期而至。今年,我们会着重介绍每月 SDK 的重要新增功能,让大家更清晰的了解到这些新功能的特性及应用场景。
重点新增功能
多人语音通话场景下的焦点语音功能
功能介绍
即构 SDK1 月新增焦点语音功能,适用于超多人语音通话场景,在多人同时说话的嘈杂环境下,依旧能聚焦特定用户的语音。支持开启多路混音模式,开发者通过设定拉流端在多路混音时要突出的目标流声音,实现特定用户语音的聚焦。
适用场景
随着疫情的反弹,全国各地中小学陆续叫停了线下教学活动,转而用空中课堂等线上的方式完成日常教学。因而,搭建一个尽可能还原现实课堂的线上教课空间,是实现高效教学的关键。
空中课堂一般为学校课程的线上化,不仅课堂人数规模大,还有像朗读、体育、音乐等此前未大规模线上化的课程,因此需要根据学科特色持续不断的优化空中课堂教学效果。以朗诵为例,既有单人朗读,也有学生齐声诵读的场景,在多人同时朗读时,老师需要分辨出不同学生的声音,进而提供针对性的指导。
即构“焦点语音”功能,让多个学生朗读时,也可实现聚焦特定学生声音。在热烈的课堂氛围中保证老师与学生以自然的方式进行互动,助力“空中课堂”实现高效的课堂教学监督,展现线上教学系统的优势。
功能优势
即构焦点语音功能,解决了空中课堂等线上教育场景下,教师同时监督多位学生朗读和学习状态的痛点。
从技术角度看,当一个线上教学课堂内有 N 个连麦通话的人,则课堂上每位成员的设备系统会输出 N-1 条音频流的数据。此时,降低设备性能开销和识别特定的说话人员,是首要考虑的技术难点。即构推出了多路混音模式,通过后台混音机制,降低用户拉取多路音频流带来的设备性能开销,同时提供突出音频流的列表,聚焦在特定的用户说话声音上,在喧闹的环境中仍支持清晰的语音通话。
其他新增功能
1.新增多种音效效果
SetVoicePreset 接口新增多种预设声音音效:清澈、高亢、嘹亮、饱满、假音、圆润、低沉、浑厚、女活力,增加实时语音趣味性。
SetReverbPreset 接口新增多种预设混响音效:嘻哈、飘渺、3D 人声、留声机,可用于烘托房间氛围。
2.视频内部采集新增支持设置旋转角度
推流端启用视频内部采集旋转功能,可设置视频输出的画面方向。在教育场景中,可调整使用高拍仪设备的拍摄角度,达到教师端与学生端画面视角观看一致的体验。
新增接口 SetCaptureFrameRotation,设置逆时针旋转 0°(默认值)、90°、180°、270°,支持在推流过程中使用。
3.新增本端设备摄像头状态回调 (Windows)
新增摄像头状态回调功能,当本端设备的摄像头发生改变时,可获取相关的状态变化事件,可用于判断摄像头设备是否正常工作。
4.拉流质量回调新增音频和视频卡顿统计指标
新增多个拉流质量回调指标:音频和视频卡顿累计次数、音频和视频卡顿累计时长、音频和视频解码累计时长。方便开发者了解拉流端在 RTC 通话场景中音频和视频的质量,通过数据洞悉业务表现。
此外,还新增了流控触发模式、摄像头权限状态查询、设置系统声卡采集音量、设置拉流缓存区间值等多项功能,实现更优质的音视频体验。完整的 SDK 迭代内容,欢迎进入“ZEGO-开发者中心”查看
版权声明: 本文为 InfoQ 作者【ZEGO即构】的原创文章。
原文链接:【http://xie.infoq.cn/article/4046c76d4cea8743112f21b70】。文章转载请联系作者。
评论