资讯详情

使用transformer的YOLOv7及TensorRT部署

点击上方“3D视觉车间,选择星标

第一时间送达干货

fbcf4b27ff8447587f3aa5024653c265.png

作者丨Rubin

来源计算机视觉CV

最近在github我看到一个博主开源仓库都惊呆了,YOLOv6还没出来怎么到?YOLOv7.稍微看了一下,原作者是基于这两年很受欢迎的transformer测试和分割模型,测试效果很好,比YOLOv5效果好很多。由此可见,基于Transformer based未来是检测模型。你会发现它学到的东西非常合理,比从很多人那里学到的更多boudingbox最好在里面选择概率范式。不多说,先上代码链接:

开源的YOLOv7功能强大,支持 YOLO, DETR, AnchorDETR等等。作者声称发现了许多开源检测框架,如YOLOv5、EfficientDetection都有自己的弱点。例如,YOLOv5实际上设计过度,代码混乱太多。更令人惊讶的是,pytorch至少有20个不同版本的版本YOLOv3-YOLOv4的重新实现,其中99.99%是完全错误的。你既不能训练你的数据集,也不能使它与原始数据集相匹配paper相比。所以有作者开源的仓库!该repo支持DETR等模型的ONNX并且可以进行导出tensorrt推理。

该repo提供以下工作:

  • YOLOv4 contained with CSP-Darknet53;

  • YOLOv7 arch with resnets backbone;

  • GridMask augmentation from PP-YOLO included;

  • Mosiac transform supported with a custom datasetmapper;

  • YOLOv7 arch Swin-Transformer support (higher accuracy but lower speed);

  • RandomColorDistortion, RandomExpand, RandomCrop, RandomFlip;

  • CIoU loss (DIoU, GIoU) and label smoothing (from YOLOv5 & YOLOv4);

  • YOLOv7 Res2net FPN supported;

  • Pyramid Vision Transformer v2 (PVTv2) supported

  • YOLOX s,m,l backbone and PAFPN added, we have a new combination of YOLOX backbone and pafpn;

  • YOLOv7 with Res2Net-v1d backbone, wefound res2net-v1dhave a better accuracy then darknet53;

  • Added PPYOLOv2 PAN neck with SPP and dropblock;

  • YOLOX arch added, now you can train YOLOX model (anchor free yolo) as well;

  • DETR: transformer based detection model andonnx export supported, as well as TensorRT acceleration;

  • AnchorDETR: Faster converge version of detr, now supported!

仓库提供快速检测Quick start和train数据集的代码和操作流程也提供了许多预训练模型可以下载,读者可以根据自己的需要下载相应的测试模型。

快速运行demo代码

python3demo.py--config-fileconfigs/wearmask/darknet53.yaml--input./datasets/wearmask/images/val2017--optsMODEL.WEIGHTSoutput/model_0009999.pth

实例分割

pythondemo.py--config-fileconfigs/coco/sparseinst/sparse_inst_r50vd_giam_aug.yaml--video-input~/Movies/Videos/86277963_nb2-1-80.flv-c0.4--optsMODEL.WEIGHTSweights/sparse_inst_r50vd_giam_aug_8bc5b3.pth

基于detectron2新推出的LazyConfig系统,使用LazyConfig模型运行

python3demo_lazyconfig.py--config-fileconfigs/new_baselines/panoptic_fpn_regnetx_0.4g.py--optstrain.init_checkpoint=output/model_0004999.pth

训练数据集

pythontrain_net.py--config-fileconfigs/coco/darknet53.yaml--num-gpus1

假如你想训练YOLOX,使用 config file configs/coco/yolox_s.yaml

导出 ONNX && TensorRT && TVM

detr

pythonexport_onnx.py--config-filedetr/config/file

SparseInst

pythonexport_onnx.py--config-fileconfigs/coco/sparseinst/sparse_inst_r50_giam_aug.yaml--video-input~/Videos/a.flv--optsMODEL.WEIGHTSweights/sparse_inst_r50_giam_aug_2b7d68.pthINPUT.MIN_SIZE_TEST512

具体操作流程可到原仓库查看,有详细分析!

检测结果

参考链接

[1]https://manaai.cn/aisolution_detail.html?id=7

[2]https://github.com/jinfagang/yolov7

本文仅进行学术分享。如有侵权行为,请联系删除。

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进4.国内首个面向工业级实战的点云处理课程5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法:算法梳理与代码实现

11.自动驾驶中的深度学习模型部署实战

12.相机模型与标定(单目+双目+鱼眼)

13.重磅!四旋翼飞行器:算法与实战

14.ROS2从入门到精通:理论与实战

15.国内首个3D缺陷检测教程:理论、源码与实战

扫码添加小助手微信,可

也可申请加入我们的细分方向交流群,目前主要有等微信群。

一定要备注:,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。也请联系。

▲长按加微信群或投稿

▲长按关注公众号

:针对3D视觉领域的五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、答疑解惑、助你高效解决问题

标签: 传感器bc5

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台