FCOS 论文复现：通用物体检测算法

2022-11-28
中国香港
本文字数：3893 字
阅读完需：约 13 分钟

本文分享自华为云社区《通用物体检测算法 FCOS(目标检测/Pytorch)》，作者： HWCloudAI 。

FCOS:Fully Convolutional One-Stage Object Detection

本案例代码是 FCOS 论文复现的体验案例此模型为 FCOS 论文中所提出算法在 ModelArts + PyTorch 框架下的实现。该算法使用 MS-COCO 公共数据集进行训练和评估。本代码支持 FCOS + ResNet-101 在 MS-COCO 数据集上完整的训练和测试流程

具体的算法介绍：https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=ce7acc40-0540-45c9-a0c6-e2fda8d1ac7e

注意事项：

1.本案例使用框架: PyTorch1.0.0

2.本案例使用硬件: GPU

3.运行代码方法: 点击本页面顶部菜单栏的三角形运行按钮或按 Ctrl+Enter 键运行每个方块中的代码

1.数据和代码下载

import osimport moxing as mox# 数据代码下载mox.file.copy_parallel('obs://obs-aigallery-zc/algorithm/FCOS.zip','FCOS.zip')# 解压缩os.system('unzip  FCOS.zip -d ./')

复制代码

2.模型训练

2.1 依赖库安装及加载

"""Basic training script for PyTorch"""
# Set up custom environment before nearly anything else is imported# NOTE: this should be the first import (no not reorder)import osimport argparseimport torchimport shutil
src_dir = './FCOS/'os.chdir(src_dir)os.system('pip install -r ./pip-requirements.txt')os.system('python -m pip install ./trained_model/model/framework-2.0-cp36-cp36m-linux_x86_64.whl')
os.system('python setup.py build develop')
from framework.utils.env import setup_environmentfrom framework.config import cfgfrom framework.data import make_data_loaderfrom framework.solver import make_lr_schedulerfrom framework.solver import make_optimizerfrom framework.engine.inference import inferencefrom framework.engine.trainer import do_trainfrom framework.modeling.detector import build_detection_modelfrom framework.utils.checkpoint import DetectronCheckpointerfrom framework.utils.collect_env import collect_env_infofrom framework.utils.comm import synchronize, \    get_rank, is_pytorch_1_1_0_or_laterfrom framework.utils.logger import setup_loggerfrom framework.utils.miscellaneous import mkdir

复制代码

2.2 训练函数

def train(cfg, local_rank, distributed, new_iteration=False):    model = build_detection_model(cfg)    device = torch.device(cfg.MODEL.DEVICE)    model.to(device)
    if cfg.MODEL.USE_SYNCBN:        assert is_pytorch_1_1_0_or_later(), \            "SyncBatchNorm is only available in pytorch >= 1.1.0"        model = torch.nn.SyncBatchNorm.convert_sync_batchnorm(model)
    optimizer = make_optimizer(cfg, model)    scheduler = make_lr_scheduler(cfg, optimizer)
    if distributed:        model = torch.nn.parallel.DistributedDataParallel(            model, device_ids=[local_rank], output_device=local_rank,            # this should be removed if we update BatchNorm stats            broadcast_buffers=False,        )
    arguments = {}    arguments["iteration"] = 0
    output_dir = cfg.OUTPUT_DIR
    save_to_disk = get_rank() == 0    checkpointer = DetectronCheckpointer(        cfg, model, optimizer, scheduler, output_dir, save_to_disk    )    print(cfg.MODEL.WEIGHT)    extra_checkpoint_data = checkpointer.load_from_file(cfg.MODEL.WEIGHT)    print(extra_checkpoint_data)    arguments.update(extra_checkpoint_data)
    if new_iteration:        arguments["iteration"] = 0
    data_loader = make_data_loader(        cfg,        is_train=True,        is_distributed=distributed,        start_iter=arguments["iteration"],    )
    do_train(        model,        data_loader,        optimizer,        scheduler,        checkpointer,        device,        arguments,    )    return model

复制代码

2.3 设置参数，开始训练

def main():    parser = argparse.ArgumentParser(description="PyTorch Object Detection Training")    parser.add_argument(        '--train_url',        default='./outputs',        type=str,        help='the path to save training outputs'    )    parser.add_argument(        "--config-file",        default="./trained_model/model/fcos_resnet_101_fpn_2x.yaml",        metavar="FILE",        help="path to config file",        type=str,    )    parser.add_argument("--local_rank", type=int, default=0)    parser.add_argument('--train_iterations', default=0, type=int)    parser.add_argument('--warmup_iterations', default=500, type=int)    parser.add_argument('--train_batch_size', default=8, type=int)    parser.add_argument('--solver_lr', default=0.01, type=float)    parser.add_argument('--decay_steps', default='120000,160000', type=str)    parser.add_argument('--new_iteration',default=False, action='store_true')
    args, unknown = parser.parse_known_args()
    cfg.merge_from_file(args.config_file)    # load the model trained on MS-COCO
    if args.train_iterations > 0:        cfg.SOLVER.MAX_ITER = args.train_iterations    if args.warmup_iterations > 0:        cfg.SOLVER.WARMUP_ITERS = args.warmup_iterations
    if args.train_batch_size > 0:        cfg.SOLVER.IMS_PER_BATCH = args.train_batch_size    if args.solver_lr > 0:        cfg.SOLVER.BASE_LR = args.solver_lr
    if len(args.decay_steps) > 0:        steps = args.decay_steps.replace(' ', ',')        steps = steps.replace(';', ',')        steps = steps.replace('；', ',')        steps = steps.replace('，', ',')        steps = steps.split(',')        steps = tuple([int(x) for x in steps])        cfg.SOLVER.STEPS = steps    cfg.freeze()
    num_gpus = int(os.environ["WORLD_SIZE"]) if "WORLD_SIZE" in os.environ else 1    args.distributed = num_gpus > 1
    if args.distributed:        torch.cuda.set_device(args.local_rank)        torch.distributed.init_process_group(            backend="nccl", init_method="env://"        )        synchronize()            output_dir = args.train_url    if output_dir:        mkdir(output_dir)
    logger = setup_logger("framework", output_dir, get_rank())    logger.info("Using {} GPUs".format(num_gpus))    logger.info(args)
    logger.info("Loaded configuration file {}".format(args.config_file))    train(cfg, args.local_rank, args.distributed, args.new_iteration)if __name__ == "__main__":    main()

复制代码

3.模型测试

3.1 预测函数

from framework.engine.predictor import Predictorfrom PIL import Image,ImageDrawimport numpy as npimport matplotlib.pyplot as plt
def predict(img_path,model_path):        config_file = "./trained_model/model/fcos_resnet_101_fpn_2x.yaml"        cfg.merge_from_file(config_file)    cfg.defrost()    cfg.MODEL.WEIGHT = model_path    cfg.OUTPUT_DIR = None    cfg.freeze()    predictor = Predictor(cfg=cfg, min_image_size=800)
    src_img = Image.open(img_path)    img = src_img.convert('RGB')    img = np.array(img)    img = img[:, :, ::-1]
    predictions = predictor.compute_prediction(img)    top_predictions = predictor.select_top_predictions(predictions)
    bboxes = top_predictions.bbox.int().numpy().tolist()
    bboxes = [[x[1], x[0], x[3], x[2]] for x in bboxes]
    scores = top_predictions.get_field("scores").numpy().tolist()    scores = [round(x, 4) for x in scores]    labels = top_predictions.get_field("labels").numpy().tolist()    labels = [predictor.CATEGORIES[x] for x in labels]    draw = ImageDraw.Draw(src_img)    for i,bbox in enumerate(bboxes):        draw.text((bbox[1],bbox[0]),labels[i] + ':'+str(scores[i]),fill=(255,0,0))        draw.rectangle([bbox[1],bbox[0],bbox[3],bbox[2]],fill=None,outline=(255,0,0))
    return src_img

复制代码

3.2 开始预测

if __name__ == "__main__":    model_path = "./outputs/weights/fcos_resnet_101_fpn_2x/model_final.pth"  # 训练得到的模型    image_path = "./trained_model/model/demo_image.jpg"   # 预测的图像
    img = predict(image_path,model_path)    plt.figure(figsize=(10,10)) #设置窗口大小    plt.imshow(img)    plt.show()

复制代码

2021-06-09 15:33:15,362 framework.utils.checkpoint INFO: Loading checkpoint from ./outputs/weights/fcos_resnet_101_fpn_2x/model_final.pth

复制代码

点击关注，第一时间了解华为云新鲜技术~

发布于: 刚刚阅读数: 3

原文链接:【http://xie.infoq.cn/article/17670436bc5910d9c6e637f9d】。文章转载请联系作者。

华为云开发者联盟

关注

提供全面深入的云计算技术干货 2020-07-14 加入

华为云开发者社区，提供全面深入的云计算前景分析、丰富的技术干货、程序样例，分享华为云前沿资讯动态，方便开发者快速成长与发展，欢迎提问、互动，多方位了解云计算！传送门：https://bbs.huaweicloud.com/

发布

暂无评论

创作场景

FCOS 论文复现：通用物体检测算法

1.数据和代码下载

2.模型训练

2.1 依赖库安装及加载

2.2 训练函数

2.3 设置参数，开始训练

3.模型测试

3.1 预测函数

3.2 开始预测

华为云开发者联盟

评论