AI 虫子种类识别数据集(近 3000 张图片已划分、已标注)|适用于 YOLO 系列深度学习分类检测任务【数据集分享】
AI 虫子种类识别数据集(近 3000 张图片已划分、已标注)|适用于 YOLO 系列深度学习分类检测任务【数据集分享】
数据集已划分为 train
、test
、val
三个子集,共计近 3000 张高清图像,每张图像都包含清晰的目标注释文件(YOLO 格式),非常适合用于深度学习模型中的目标检测与分类任务,特别是 YOLOv5、YOLOv8、YOLOv11 等模型的训练与测试。
背景
在农业智能化与生态研究中,虫害识别一直是计算机视觉中的重要应用方向。不同种类的昆虫对作物、林木等有着截然不同的影响,及时准确识别虫子种类对于灾害预警、防治投放具有实际意义。
然而,公开可用的虫子图像数据集较为稀缺,尤其是面向小样本、边缘设备部署场景下的高质量虫子目标检测数据集更是凤毛麟角。因此,我们整理并清洗了一个近 3000 张图片的虫子识别数据集,涵盖多种常见虫子种类,标注标准规范,便于训练 YOLO 类目标检测算法。
数据集概述
数据集中每张图像都配有 YOLO 格式标注文件,标注内容包括虫子在图像中的类别编号和边界框(bounding box)坐标信息,适合用于目标检测训练任务。
该结构简单明晰,开箱即用,便于接入各种深度学习训练流程。


数据集详情
图像总数:近 3000 张
图像格式:JPG(部分为 PNG)
分辨率:大多在 720p 以上
注释格式:YOLO 格式
.txt
,与图像同名类别数量:共计 7 类常见虫子
数据划分:
train
: 2089 张val
: 447 张test
: 448 张
数据来源包括实地拍摄图像、公开虫子图像资源、手工清洗处理后的标注数据。所有标注均由专业人员完成,确保了高准确性和实用性。
所有类别均有丰富的样本图像,部分小样本类别适合用于数据增强、Few-shot 等研究场景。
每个样本图像均包含虫体在图像中的 边界框(bounding box)坐标,并指明具体类别编号,完全遵循 YOLO 格式。例如某张图像的标注文件内容为:
表示第 4 类虫子在图像中的相对位置与大小。


适用场景
本数据集适用于多种计算机视觉研究与实际应用场景:
✅ YOLOv5 / YOLOv8 / YOLOv11 等目标检测模型训练
✅ 多类虫子识别分类研究
✅ 数据增强/迁移学习实验
✅ 小样本学习 / 农业害虫识别模型开发
✅ AIoT 边缘设备部署测试
同时该数据集也适合用作学生科研课题、AI 竞赛、学术研究中的标准基准测试集。

结语
本数据集的发布旨在推动 AI 在生态虫害识别领域的落地应用,为模型提供高质量、结构清晰的数据资源。我们鼓励大家在遵守开源协议的前提下进行使用、训练与改进,也欢迎反馈优化建议。
后续我们也将提供基于该数据集的 YOLO 训练脚本、PyTorch 使用示例、轻量化部署方案等配套资源,助力各类 AI 虫害识别项目高效落地。
数据集分享
通过网盘分享的文件:AI 虫子种类识别数据集
链接: https://pan.baidu.com/s/1HC7vzPCHxr_WiYpt9sVgqQ?pwd=ru4c
版权声明: 本文为 InfoQ 作者【申公豹】的原创文章。
原文链接:【http://xie.infoq.cn/article/16da009749bbdc003fd664f82】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论