美文网首页
[图像算法]-快速上手使用PaddleX—Faster RCNN

[图像算法]-快速上手使用PaddleX—Faster RCNN

作者: 六千宛 | 来源:发表于2021-02-05 10:37 被阅读0次

    前言

    PaddleX简介:PaddleX是飞桨全流程开发工具,集飞桨核心框架、模型库、工具及组件等深度学习开发所需全部能力于一身,打通深度学习开发全流程,并提供简明易懂的Python API,方便用户根据实际生产需求进行直接调用或二次开发,为开发者提供飞桨全流程开发的最佳实践。目前,该工具代码已开源于GitHub,同时可访问PaddleX在线使用文档,快速查阅读使用教程和API文档说明。
    PaddleX代码GitHub链接https://github.com/PaddlePaddle/PaddleX/tree/develop
    PaddleX文档链接https://paddlex.readthedocs.io/zh_CN/develop/index.html
    PaddleX官网链接https://www.paddlepaddle.org.cn/paddle/paddlex
    PaddleX用户QQ群: 1045148026

    Faster RCNN简介

    Faster RCNN是一个目标检测模型,将特征抽取、候选框提取、bounding box回归、分类集成在了一个网络中,使得检测速度和精度有所提升。本文档在一个小数据集上展示了如何通过PaddleX进行训练和预测。

    1.安装PaddleX

    ! pip install paddlex -i https://mirror.baidu.com/pypi/simple
    

    2.准备昆虫目标检测数据集

    ! wget https://bj.bcebos.com/paddlex/datasets/insect_det.tar.gz
    ! tar xzf insect_det.tar.gz
    

    3.模型训练

    3.1 配置GPU

    # 设置使用0号GPU卡(如无GPU,执行此代码后仍然会使用CPU训练模型)
    import matplotlib
    matplotlib.use('Agg') 
    import os
    os.environ['CUDA_VISIBLE_DEVICES'] = '0'
    import paddlex as pdx
    

    3.2 定义图像处理流程transforms

    定义数据处理流程,其中训练和测试需分别定义,训练过程包括了部分测试过程中不需要的数据增强操作,如在本示例中,训练过程使用了RandomHorizontalFlip数据增强方式,更多图像预处理流程transforms的使用可参见paddlex.det.transforms

    from paddlex.det import transforms
    train_transforms = transforms.Compose([
        transforms.RandomHorizontalFlip(),
        transforms.Normalize(),
        transforms.ResizeByShort(short_size=800, max_size=1333),
        transforms.Padding(coarsest_stride=32)
    ])
    
    eval_transforms = transforms.Compose([
        transforms.Normalize(),
        transforms.ResizeByShort(short_size=800, max_size=1333),
        transforms.Padding(coarsest_stride=32),
    ])
    

    3.3 定义数据集Dataset

    目标检测可使用VOCDetection格式和COCODetection两种数据集,此处由于数据集为VOC格式,因此采用pdx.datasets.VOCDetection来加载数据集,该接口的介绍可参见文档paddlex.datasets.VOCDetection

    train_dataset = pdx.datasets.VOCDetection(
        data_dir='insect_det',
        file_list='insect_det/train_list.txt',
        label_list='insect_det/labels.txt',
        transforms=train_transforms,
        shuffle=True)
    eval_dataset = pdx.datasets.VOCDetection(
        data_dir='insect_det',
        file_list='insect_det/val_list.txt',
        label_list='insect_det/labels.txt',
        transforms=eval_transforms)
    

    3.4 模型开始训练

    使用本数据集在P40上训练,如有GPU,模型的训练过程预估为9分钟左右;如无GPU,则预估为6小时左右。更多训练模型的参数可参见文档paddlex.det.FasterRCNN。模型训练过程每间隔save_interval_epochs轮会保存一次模型在save_dir目录下,同时在保存的过程中也会在验证数据集上计算相关指标,具体相关日志参见文档

    AIStudio使用VisualDL查看训练过程中的指标变化

    1. 点击左边菜单图标的『可视化』;
    2. 设置logdir,logdir的路径为训练代码中save_dir指定的目录下的vdl_log目录,例如output/faster_rcnn_r50_fpn/vdl_log
    3. 点击下方『启动VisualDL服务按钮』,再『打开VisualDL』即可
    num_classes = len(train_dataset.labels) + 1
    model = pdx.det.FasterRCNN(num_classes=num_classes)
    model.train(
        num_epochs=12,
        train_dataset=train_dataset,
        train_batch_size=2,
        eval_dataset=eval_dataset,
        learning_rate=0.0025,
        lr_decay_epochs=[8, 11],
        save_interval_epochs=1,
        save_dir='output/faster_rcnn_r50_fpn',
        use_vdl=True)
    

    4.模型预测

    使用模型进行预测,同时使用pdx.det.visualize将结果可视化,可视化结果将保存到./output/faster_rcnn_r50_fpn下,其中threshold代表Box的置信度阈值,将Box置信度低于该阈值的框过滤不进行可视化。

    此处请在AIStudio Notebook页面的右上角菜单,选择重启执行器,以释放显存,重新加载训练好的模型

    import paddlex as pdx
    model = pdx.load_model('output/faster_rcnn_r50_fpn/best_model')
    image_name = 'insect_det/JPEGImages/0216.jpg'
    result = model.predict(image_name)
    pdx.det.visualize(image_name, result, threshold=0.5, save_dir='./output/faster_rcnn_r50_fpn')
    

    可视化结果如下所示:


    image

    5.反馈

    有问题欢迎随时评论

    相关文章

      网友评论

          本文标题:[图像算法]-快速上手使用PaddleX—Faster RCNN

          本文链接:https://www.haomeiwen.com/subject/cbebtltx.html