写点什么

AI 自助帮你换背景,超强实时人像扣图算法开源啦!

用户头像
百度大脑
关注
发布于: 2021 年 08 月 27 日

谈到人像抠图想必大家都不陌生。在影视剪辑、直播娱乐、线上教学、视频会议等场景中都有人像分割的身影,它可以帮助用户实时、精准地将人物和背景精准识别出来,实现更精细化的人物美颜、背景虚化替换、弹幕穿人等,进一步提升视觉应用体验。





高精度的实时人像抠图模型一直是学术和产业界研究的重点,为此 PaddleSeg 团队开源了多场景覆盖的 PP-HumanSeg 人像系列模型:

  • PP-HumanSeg 提供了 3 个高精度的人像分割模型:


    有应用于服务端 GPU 部署的 PP-HumanSegl 模型,有适用于移动端的轻量 PP-HumanSegm 模型,还有能够在浏览器部署的超轻量模型 PP-HumanSegs 模型。

  • 提供了完善的服务端、移动端、Web 端部署文档,尤其是 Web 端提供了产业级的实时人像分割解决方案。



近期“百度视频会议”也上线虚拟背景功能,支持用户在视频会议时进行人像背景切换。这个功能正是基于 PP-HumanSeg 提供的超轻量的 PP-HumanSegs 来实现。通过 Padddle.js 实现了在 Web 端部署,直接利用浏览器的算力进行实时人像抠图,效果受到一致好评!


模型性能如此之好,是不是迫不及待地想知道如何实现的?

大规模数据合成和数据增强

在训练集里有各种比例的图片,有横屏的,有竖屏的。如果直接使用缩放变形等数据增强方式,会直接导致形变失真,反而不会提升精度。针对此类问题,采用维持图像纵横比缩放、Padding 补齐等方式缩放图像达到原图比例。通过这些方式处理后图像不会失真,训练精度也得到了提升。


针对人像标注样本少的问题,使用标注信息和背景图合成的方式进行数据生成,数据量的扩充提升了模型的精度。


轻量级网络设计方式

对于移动端和网页端的人像分割,一个高效的轻量级网络必不可少,在这里为大家总结了一些轻量化关键设计方法。

关键一:深度可分离卷积

深度可分离卷积是一种卷积分解方式,将普通卷积分解为 Depthwise Convolution 和 Pointwise Convolution,主要目的是减少计算量和参数量,此方式已被广泛应用在轻量级卷积网络中。

关键二:Channel Shuffle(通道洗牌)

在深度可分离卷积中用到的 Depthwise Convolution 会将所有的 channel 分组,每个 channel 分为一组,这就导致组与组之间无信息交换。Channel Shuffle 通过对 group convolution 之后的特征图进行“重组”,可以保证接下了采用的 group convolution 输入来自不同的组,因此信息可以在不同组之间流转。



关键三:Skip-connection(跳跃连接)

对于分割任务,空间域信息非常重要。主流的分割网络均采用 encoder-decoder 结构。网络的 encoder 部分通过下采样层把特征图分辨率降得非常小,这一点不利于精确的分割 mask 生成,通过 skip-connection 跨层连接编码器和解码器,更利于生成精细的 mask。Skip-connection 直接复用 encoder 的特征,几乎不增加计算量,性价比非常之高!

关键四:上采样方法

Decoder 的主要目的是将低分辨率信息的特征恢复到高分辨率。为了实现这个目的就需要上采样。常用的上采样方式有四类:转置卷积、反池化、插值、亚像素卷积。

当使用转置卷积进行上采样的时候,容易出现棋盘效应(左图肩膀处)。开发团队为平衡计算量、显存占用和效果,最终采用深度可分离卷积+双线性插值,在保持高效计算的同时解决了棋盘效应问题。


综合考虑上述四个关键,开发团队设计了 Web 端超轻量级模型 PP-HumanSegs。



优化损失函数解决类别不均衡

人像在整张图片中所占的比例往往较小,存在前景背景类别占比不均衡的问题。常用的 Cross Entropy Loss 会公平处理正负样本,当出现正样本占比较小时,就会被更多的负样本淹没。通过改变损失函数,使用 Lovasz loss 来降低正负样本不均衡的问题。

光流后处理优化

视频分割存在一个问题:视频帧间不连贯,边缘部分闪烁严重,为此研发团队利用时序信息结合光流法,对分割结果进行优化。采用光流解决方法,将光流预测结果与分割结果进行融合,这样就可以参考上一帧的运动信息,使得前后帧变换相对更加稳定,减少边缘的闪烁。




             原图(左)     未加光流效果(中)     加光流效果(右)   

心动不如行动,大家可以直接前往 Github 地址获得完整开源项目代码,记得 Star 收藏支持一下哦:

https://github.com/PaddlePaddle/PaddleSeg


百度 AI 开发者社区https://ai.baidu.com/forum ,为全国各地开发者提供一个交流、分享、答疑解惑的平台,让开发者在研发路上不再“孤军奋战”,通过不断地交流与探讨找出更好的技术解决方案。如果你想尝试各种人工智能技术、开拓应用场景,赶快加入百度 AI 社区,你对 AI 的所有畅想,在这里都可以实现!

扫描下方二维码,添加小助手微信「京东卡、小度定制周边、神秘礼盒、行李箱」等更多福利你来拿~


发布于: 2021 年 08 月 27 日阅读数: 5
用户头像

百度大脑

关注

用科技让复杂的世界更简单 2020.07.15 加入

百度大脑是百度技术多年积累和业务实践的集大成,包括视觉、语音、自然语言处理、知识图谱、深度学习等 AI 核心技术和 AI 开放平台。 即刻获取百度AI相关技术,可访问 ai.baidu.com了解更多!

评论

发布
暂无评论
AI自助帮你换背景,超强实时人像扣图算法开源啦!