写点什么

AI 虫子种类识别数据集(近 3000 张图片已划分、已标注)|适用于 YOLO 系列深度学习分类检测任务【数据集分享】

作者:申公豹
  • 2025-07-19
    陕西
  • 本文字数:1163 字

    阅读完需:约 4 分钟

AI 虫子种类识别数据集(近 3000 张图片已划分、已标注)|适用于 YOLO 系列深度学习分类检测任务【数据集分享】

数据集已划分为 traintestval 三个子集,共计近 3000 张高清图像,每张图像都包含清晰的目标注释文件(YOLO 格式),非常适合用于深度学习模型中的目标检测与分类任务,特别是 YOLOv5、YOLOv8、YOLOv11 等模型的训练与测试。

背景

在农业智能化与生态研究中,虫害识别一直是计算机视觉中的重要应用方向。不同种类的昆虫对作物、林木等有着截然不同的影响,及时准确识别虫子种类对于灾害预警、防治投放具有实际意义。


然而,公开可用的虫子图像数据集较为稀缺,尤其是面向小样本、边缘设备部署场景下的高质量虫子目标检测数据集更是凤毛麟角。因此,我们整理并清洗了一个近 3000 张图片的虫子识别数据集,涵盖多种常见虫子种类,标注标准规范,便于训练 YOLO 类目标检测算法。

数据集概述

数据集中每张图像都配有 YOLO 格式标注文件,标注内容包括虫子在图像中的类别编号和边界框(bounding box)坐标信息,适合用于目标检测训练任务。


dataset/├── images/│   ├── train/│   ├── val/│   └── test/├── labels/│   ├── train/│   ├── val/│   └── test/
复制代码


该结构简单明晰,开箱即用,便于接入各种深度学习训练流程。



数据集详情

  • 图像总数:近 3000 张

  • 图像格式:JPG(部分为 PNG)

  • 分辨率:大多在 720p 以上

  • 注释格式:YOLO 格式 .txt,与图像同名

  • 类别数量:共计 7 类常见虫子

  • 数据划分

  • train: 2089 张

  • val: 447 张

  • test: 448 张


数据来源包括实地拍摄图像、公开虫子图像资源、手工清洗处理后的标注数据。所有标注均由专业人员完成,确保了高准确性和实用性。


所有类别均有丰富的样本图像,部分小样本类别适合用于数据增强、Few-shot 等研究场景。


每个样本图像均包含虫体在图像中的 边界框(bounding box)坐标,并指明具体类别编号,完全遵循 YOLO 格式。例如某张图像的标注文件内容为:


3 0.512 0.439 0.187 0.274
复制代码


表示第 4 类虫子在图像中的相对位置与大小。



适用场景

本数据集适用于多种计算机视觉研究与实际应用场景:


  • ✅ YOLOv5 / YOLOv8 / YOLOv11 等目标检测模型训练

  • ✅ 多类虫子识别分类研究

  • ✅ 数据增强/迁移学习实验

  • ✅ 小样本学习 / 农业害虫识别模型开发

  • ✅ AIoT 边缘设备部署测试


同时该数据集也适合用作学生科研课题、AI 竞赛、学术研究中的标准基准测试集。


结语

本数据集的发布旨在推动 AI 在生态虫害识别领域的落地应用,为模型提供高质量、结构清晰的数据资源。我们鼓励大家在遵守开源协议的前提下进行使用、训练与改进,也欢迎反馈优化建议。


后续我们也将提供基于该数据集的 YOLO 训练脚本PyTorch 使用示例轻量化部署方案等配套资源,助力各类 AI 虫害识别项目高效落地。

数据集分享

通过网盘分享的文件:AI 虫子种类识别数据集


链接: https://pan.baidu.com/s/1HC7vzPCHxr_WiYpt9sVgqQ?pwd=ru4c

发布于: 刚刚阅读数: 2
用户头像

申公豹

关注

🏆2022年InfoQ写作平台-签约作者 🏆 2023-06-05 加入

还未添加个人简介

评论

发布
暂无评论
AI虫子种类识别数据集(近3000张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】_数据集_申公豹_InfoQ写作社区