使用监督学习训练图像聚类模型
基于监督学习的图像聚类新范式
传统机器学习模型依赖标注数据进行监督学习,而获取标注数据成本高昂。无监督学习的主要方法是聚类,即根据显著特征将数据点分组。传统聚类算法依赖启发式规则(如聚类中心距离阈值或分布形态)确定边界。在 ICCV 2021 发表的论文中,我们提出从数据中学习边界划分的方法。
技术架构
图表示构建
使用元训练数据训练监督分类器(编码器-解码器结构)
仅保留编码器将图像转换为特征向量
基于特征空间构建 k 近邻图,节点代表图像
层次化图神经网络(Hi-LANDER)
基础模型 LANDER(链接近似与密度估计优化):
通过 GNN 生成节点嵌入
联合预测节点链接(同类别连接)和局部数据密度
层次化处理:
首轮聚类后将簇聚合为超节点
迭代执行近邻连接和 GNN 处理直至无新边产生
核心创新
双目标联合训练:首次在单一模型中同时优化链接预测和密度预测任务
全图处理机制:突破传统子图划分限制,实现全局信息流动
元训练迁移:在测试集类别与训练数据零重叠(0%)或极低重叠(<2%)时仍保持优异表现
实验成果
当前研究正探索构建通用聚类模型,以实现在人脸、动物物种等不同数据类型间的迁移聚类能力。
更多精彩内容 请关注我的个人公众号 公众号(办公 AI 智能小助手)公众号二维码

办公AI智能小助手
评论