MODEL_ZOO_cn.md 4.1 KB

模型库和基线

测试环境

  • Python 3.7
  • PaddlePaddle 每日版本
  • CUDA 10.1
  • cuDNN 7.5
  • NCCL 2.4.8

通用设置

  • 所有模型均在COCO17数据集中训练和测试。
  • 除非特殊说明,所有ResNet骨干网络采用ResNet-B结构。
  • 推理时间(fps): 推理时间是在一张Tesla V100的GPU上通过'tools/eval.py'测试所有验证集得到,单位是fps(图片数/秒), cuDNN版本是7.5,包括数据加载、网络前向执行和后处理, batch size是1。

训练策略

  • 我们采用和Detectron相同的训练策略。
  • 1x 策略表示:在总batch size为8时,初始学习率为0.01,在8 epoch和11 epoch后学习率分别下降10倍,最终训练12 epoch。
  • 2x 策略为1x策略的两倍,同时学习率调整位置也为1x的两倍。

ImageNet预训练模型

Paddle提供基于ImageNet的骨架网络预训练模型。所有预训练模型均通过标准的Imagenet-1k数据集训练得到,ResNet和MobileNet等是采用余弦学习率调整策略或SSLD知识蒸馏训练得到的高精度预训练模型,可在PaddleClas查看模型细节。

基线

Faster R-CNN

请参考Faster R-CNN

Mask R-CNN

请参考Mask R-CNN

Cascade R-CNN

请参考Cascade R-CNN

YOLOv3

请参考YOLOv3

SSD

请参考SSD

FCOS

请参考FCOS

SOLOv2

请参考SOLOv2

PP-YOLO

请参考PP-YOLO

TTFNet

请参考TTFNet

Group Normalization

请参考Group Normalization

Deformable ConvNets v2

请参考Deformable ConvNets v2

HRNets

请参考HRNets

Res2Net

请参考Res2Net

GFL

请参考GFL

PicoDet

请参考PicoDet

PP-YOLOE

请参考PP-YOLOE

YOLOX

请参考YOLOX

旋转框检测

S2ANet

请参考S2ANet

关键点检测

PP-TinyPose

请参考PP-TinyPose

HRNet

请参考HRNet

HigherHRNet

请参考HigherHRNet

多目标跟踪

DeepSORT

请参考DeepSORT

JDE

请参考JDE

FairMOT

请参考FairMOT

ByteTrack

请参考ByteTrack