三项国际人工智能顶会大奖!拿下!
近日,国际人工智能顶会 CVPR 2024 举办的第 6 届自然场景情感行为分析挑战赛(6th Workshop and Competition on Affective Behavior Analysis in-the-wild,简称 ABAW)公布比赛结果,天翼云 AI 团队(CtyunAI)在情感识别任务中表现出色,斩获双赛道亚军、单个赛道季军,并受邀在 CVPR ABAW 研讨会上作论文分享。这是继天翼云在 CVPR 中荣获多次佳绩后再一次斩获殊荣。
CVPR 会议是由 IEEE 主办的关于计算机视觉和模式识别的国际学术会议,收录了该领域最新的研究成果和技术发展,是全球计算机视觉三大顶级会议之一。
ABAW 竞赛是由国际顶级计算机视觉研究者和科学家们共同发起的竞赛,致力于解决自然情境下计算机对人的情感行为进行分析的问题,并以此提升人机交互系统的场景应用能力,目标是创造出能够理解人的感觉、情绪和行为的机器和机器人,从而让机器能够与人类互动并有效地成为人类的数字助手。
本届竞赛共吸引了来自世界各地的 100 多支团队参加,其中不乏国内外知名大学和研究机构,如中国科学院、中国科学技术大学等。参赛队伍需要对来源于现实场景的 594 个视频共 300 万帧图像进行分析,通过视频中的图像、人物、声音来预测指定人物在连续时间下的情感。
天翼云 AI 团队在本次竞赛中尝试简化问题,仅使用纯视觉特征进行任务建模。首先,通过使用可扩展的 vision 表征学习的掩码式自动编码器(Masked Autoencoder)在大量人脸表情相关的数据集上进行预训练,以学习鲁棒的图像表征;其次,在比赛提供的 aff-wild2 数据集上使用 Expr 标签进行微调,以更好地适合该数据集的分布;最后,利用时域卷积网络(Temporal Convolutional Network)和 Transformer 对数据在时间维度上进行建模,从而使模型能够通过视频的上下文对结果进行预测,大大提升了模型的任务表现。
当前,以大模型为代表的 AI 技术的发展及应用已步入爆发期,并成为驱动产业数字化与智能化的重要引擎。天翼云将继续在图像、音频及多模态领域持续深耕,不断夯实国云智算底座,推动 AI 技术变革升级,为数字经济发展注入新的活力。
评论