🏆【声网 Agora】「PC 端实现实时语音通讯 4.x」
承接上文
基于上文的语音服务端搭建之后[https://xie.infoq.cn/article/14ac0e853cea76cdf49c39fe2],我们即可以实现相关的客户端的开发,进行语音通讯的实现方案。这里终端方式很多,例如 Android 或者 IOS,这里我们采用 Web 服务端进行开发。
语音通话
语音通话可以实现纯语音的一对一单聊和多人群聊,不具备视频通话功能,包体积更小,适用于各种语音社交、语音会议等场景。
开发特性
针对于语音通话的功能场景可参考https://docs.agora.io/cn/Voice/product_voice?platform=Web#功能和场景
针对于语音通话的关键特性可参考https://docs.agora.io/cn/Voice/product_voice?platform=Web#关键特性
针对于语音通话的平台兼容性可参考https://docs.agora.io/cn/Voice/product_voice?platform=Web#平台兼容
环境准备
由于浏览器的安全策略对除 127.0.0.1 以外的 HTTP 地址作了限制,Agora Web SDK 仅支持 HTTPS 协议或者 http://localhost(http://127.0.0.1)。请勿使用 HTTP 协议在 http://localhost(http://127.0.0.1) 之外访问你的项目。
需要准备 Agora 账号
具体参考注册与登录 (agora.io)或【https://xie.infoq.cn/article/14ac0e853cea76cdf49c39fe2】
里面的相关步骤介绍即可。
集成 AgoraSDK
使用 npm 获取 SDK
使用该方法需要先安装 npm,详见 npm 快速入门。
运行安装命令:
在你的项目的 JavaScript 代码中加入以下代码,引入这个模块:
如果你使用 TypeScript, 还可以引入 SDK 中的类型对象:
使用 CDN 方法获取 SDK
(我最喜欢的方法,但会非常依赖于网络)该方法无需下载安装包。在项目 HTML 文件中,添加如下代码:
手动下载 SDK
下载 Agora Web SDK 4.x 版本 SDK 包。
将下载下来的 js 文件保存到项目文件所在的目录下。
在项目文件中,将如下代码添加到 HTML 中:
使用 AgoraAPI
在方法 2 和方法 3 中,SDK 都会在全局导出一个 AgoraRTC 对象,直接访问这个对象即可操作 SDK。
我们已经将 Agora Web SDK 集成到项目中了。下一步我们要调用 Agora Web SDK 提供的核心 API。
音频流由音频轨道构成。在 Agora Web SDK 中,我们通过操作音频轨道对象来控制音频流的行为。
图片来源:https://web-cdn.agora.io/docs-files/1617875857986
参数全局定义
创建本地客户端
AgoraRTCClient 它代表一个本地客户端。 AgoraRTCClient 类的方法提供了音频通话的主要功能,例如加入频道、发布音频轨道等。根据项目的 App ID 创建一个本地客户端 AgoraRTCClient 对象调用 createClient 方法创建本地客户端对象。具体代码如下:
需注意 mode 和 codec 这两个参数的设置:
mode 用于设置频道场景。是 Agora 为了对不同的实时音视频场景进行针对性算法优化而提供的一种设置选项。SDK 支持两种频道场景:"rtc"(通信场景) 和 "live"(直播场景)。Agora Web SDK 会根据使用场景的不同实行不同的优化策略。一对一或多人通话中,建议设为 "rtc",使用通信场景。互动直播中,建议设为 "live",使用直播场景。
"
rtc"(通信场景)适用于频道内所有用户需要相互交流且用户总数不太多的场景,如多人会议和在线聊天。"live"(直播场景)适用于发布端很少但是订阅端很多的场景,这种场景下 SDK 定义了两种用户角色:观众(默认)和主播。主播能够发送和接收音视频,观众不能发送、只能接收音视频。你可以通过设置 createClient 的 role 参数来指定用户角色,也可以调用 setClientRole 来动态修改用户角色。
codec
用于设置浏览器使用的编解码格式,支持"vp8"
(VP8)和"h264"
(H.264)两种视频编码格式。。如果你需要使用 Safari 12.1 及之前版本,将该参数设为"h264"
;其他情况我们推荐使用"vp8"
,设置只会影响发布端的视频编码格式,对于订阅端来说只要其支持该格式的解码,都能正常完成订阅。
桌面端 Chrome 58 及以上版本既支持 VP8 也支持 H.264,而 Safari 12.1 以下版本不支持 VP8 编解码;如果频道中有两个主播分别发布了 VP8 和 H.264 的视频流,使用桌面端 Chrome 58 的观众可以解码这两个主播的视频,使用 Safari 12.1 以下版本浏览器的观众只能解码 H.264 的视频流。
加入目标频道
调用 join 加入目标频道。该方法返回一个 Promise,当返回 resolve 时表示加入频道成功,返回 reject 时表示加入频道出现错误。我们可以利用 async/await 极大地简化我们的代码。
调用 join
方法时你需要注意以下参数:
appid: 你的 App ID。
channel: 频道名,长度在 64 字节以内的字符串。在我们的示例项目中,channel 的值设为 demo_channel_name。
token: (可选)如果你的 Agora 项目开启了 App 证书,你需要在该参数中传入一个 Token,详见使用 Token。在测试环境,我们推荐使用控制台生成临时 Token,详见获取临时 Token。在生产环境,我们推荐你在自己的服务端生成 Token,详见生成 Token。
在我们的示例项目中,为了叙述方便,没有开启 App 证书,所以不需要校验 Token,
token
的值为null
。如果你启用了 App 证书,请确保上面传入的 channel 值和生成 Token 时传入的 channel 值保持一致。uid:用户 ID,频道内每个用户的 UID 必须是唯一的。你可以填 null,Agora 会自动分配一个 UID 并在 join 的结果中返回。
创建并发布本地音频轨道
LocalTrack 对象和 RemoteTrack 对象,代表本地和远端的音频轨道对象,用于播放等音频相关的控制。
我们先调用 createMicrophoneAudioTrack 通过麦克风采集的音频创建本地音频轨道对象,然后调用 publish 方法,将这些本地音频轨道对象当作参数即可将音频发布到频道中。
以上方法都会返回 Promise,resolve 时代表成功,reject 时代表失败。我们使用 async/await 来让代码逻辑更清晰。
由于加入频道和创建本地音频轨道没有依赖关系,你可以利用 Promise.all 同时执行这些异步操作。
取消发布音视频
成功发布本地轨道后,如果想取消发布,可以调用 AgoraRTCClient.unpublish。
关于取消发布,注意事项如下:
该方法可以多次调用。你可以使用 publish 和 unpublish 实现发布和取消发布某个本地轨道。
该方法为异步方法,使用时需要配合 Promise 或 async/await。
订阅远端用户
当远端用户成功发布音视频轨道之后,SDK 会触发 user-published 事件。这个事件携带两个参数:远端用户对象(user)和远端发布的媒体类型(mediaType)。此时,你可以调用 AgoraRTCClient.subscribe 发起订阅。
当远端用户发布音频轨道时,SDK 会触发 client.on("user-published") 事件。我们需要通过 client.on 监听该事件并在回调中订阅新加入的远端用户。
建议在创建客户端对象之后立即监听事件,以避免错过任何事件。放在这里介绍是因为叙述顺序。
在 createClient 后下一行插入以下代码,监听 client.on("user-published") 事件,当有远端用户发布时开始订阅,并在订阅后自动播放远端音频轨道对象。
当订阅方法调用完成之后,你可以通过 user.audioTrack 和 user.videoTrack 获取相应的 RemoteAudioTrack 和 RemoteVideoTrack 对象。
订阅和发布不同,每次订阅只能订阅一个音频或视频轨道。即使发布端同时发布了音频轨道和视频轨道,SDK 也会触发两次 user-published 事件:一次 user-published(audio),一次 user-published(video)。按照上面的代码逻辑,会完成两次订阅。
user-published 事件的第二个参数 mediaType,代表远端用户当前发布的媒体类型:
audio: 远端用户发布了音频轨道。
video: 远端用户发布了视频轨道。
当远端用户取消发布或离开频道时,SDK 会触发 client.on("user-unpublished") 事件。
取消订阅音视频
你可以通过 AgoraRTCClient.unsubscribe 取消订阅远端的音视频。
[订阅目标用户的音视频]
关于取消订阅,注意事项如下:
取消订阅成功后,SDK 会释放相应的 RemoteTrack 对象。一旦远端轨道对象被释放,SDK 会自动移除视频的播放元素,音频播放也会停止。
如果远端用户主动取消发布,本地会收到 user-unpublished 回调,收到该回调时 SDK 会自动释放相应的 RemoteTrack 对象,你无需再调用 unsubscribe。
该方法为异步方法,使用时需要配合 Promise 或 async/await。
调整通话音量
在使用 Agora Web SDK 时,你可以对 SDK 采集到的声音及 SDK 播放的声音音量进行调整,以满足产品在声音上的个性化需求。比如进行双人通话时,可以通过这个功能调整麦克风采集音量或者远端用户音量。
SDK 为本地音频轨道和远端音频轨道对象分别提供 setVolume 方法用于调整本地音频的采集音量和远端音频的播放音量。
调节远端音频的播放音量
以下示例中 remoteUser 是指已订阅的远端用户对象。
调节本地音频的采集音量
以下示例中 localAudioTrack 是指自己创建的本地音频轨道对象。
离开频道
调用 leave 后,SDK 会立刻销毁与当前频道相关的对象,包括订阅的远端用户对象、远端轨道对象、
记录连接状态的对象等。如果需要再次加入频道,在调用 leave 后再调用 join 即可。
通过以下步骤离开频道:
销毁创建的本地音频轨道,解除网页对麦克风的访问。
调用 leave 离开频道。
在加入频道的过程中,因为 SDK 使用不当或者网络异常等原因,可能会抛出以下错误:
INVALID_PARAMS: 提供的参数错误,比如提供了格式非法的 Token。
INVALID_OPERATION: 非法操作。该错误通常是重复加入频道引起的,请确保重复加入时先调用 leave。
OPERATION_ABORTED: 加入被中止,表示在 join 方法成功之前就调用了 leave 方法。
UNEXPECTED_RESPONSE: Agora 服务器返回了非预期的响应,通常是因为 App ID 或 Token 鉴权失败,例如开启了 App 证书却未传入 Token。
UID_CONFLICT: 创建了多个 AgoraRTCClient 对象,且重复使用了同一个用户 ID。
版权声明: 本文为 InfoQ 作者【李浩宇/Alex】的原创文章。
原文链接:【http://xie.infoq.cn/article/456315bdef870e22f4a5fc1f8】。文章转载请联系作者。
评论