jjzjj

Detectors

全部标签

【论文阅读】YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

原始题目:YOLOv7:Trainablebag-of-freebiessetsnewstate-of-the-artforreal-timeobjectdetectors中文翻译:YOLOv7:可训练的免费包为实时目标检测器设置了最新的技术发表时间:2022年7月6日平台:arXiv来源:中央研究院信息科学研究所,台湾文章链接:https://arxiv.org/pdf/2207.02696.pdf开源代码:GitHub-WongKinYiu/yolov7:Implementationofpaper-YOLOv7:Trainablebag-of-freebiessetsnewstate-of

论文阅读:YOLOV: Making Still Image Object Detectors Great at Video Object Detection

发表时间:2023年3月5日论文地址:https://arxiv.org/abs/2208.09686项目地址:https://github.com/YuHengsss/YOLOV视频物体检测(VID)具有挑战性,因为物体外观的高度变化以及一些帧的不同恶化。有利的信息是,与静止图像相比在视频的某一帧中检测,可以从其他帧中获得支持。因此,如何在不同的框架之间聚合特性是VID问题的关键。大多数现有的聚合算法都是为两阶段检测器定制的。然而,由于这些探测器的两阶段性质,其计算成本通常很昂贵。本文提出了一个简单而有效的策略来解决上述问题,该问题会带来微量计算量,但使准确性有显著提高。具体地说,与传统的两

【目标检测论文阅读笔记】RTMDet: An Empirical Study of Designing Real-Time Object Detectors(2022)

Abstract        在本文中,我们的目标是设计一种高效的实时物体检测器,它超越了YOLO系列,并且可以轻松扩展到许多物体识别任务,例如实例分割和旋转物体检测。为了获得更高效的模型架构,我们探索了一种 在主干和颈部具有兼容能力的架构,该架构 由一个由大核深度卷积组成的基本构建块构建。我们在动态标签分配中计算匹配成本时进一步引入软标签以提高准确性。结合更好的训练技术,由此产生的名为RTMDet的目标检测器在NVIDIA3090GPU上以300+FPS的速度在COCO上实现了52.8%的AP,优于当前主流的工业检测器。RTMDet针对各种应用场景实现了tiny/small/medium/

CVPR2022知识蒸馏用于目标检测:Focal and Global Knowledge Distillation for Detectors

论文下载:https://arxiv.org/abs/2111.11837源码下载:https://github.com/yzd-v/FGDAbstract知识蒸馏已成功应用于图像分类。然而目标检测要复杂得多,大多数知识蒸馏方法都失败了。本文指出,在目标检测中,教师和学生的特征在不同的区域有很大的差异,尤其是在前景和背景中。如果我们平均蒸馏它们,特征图之间的不均匀差异将对蒸馏产生负面影响。因此,我们提出了局部和全局蒸馏(FGD)。局部蒸馏分离了前景和背景,迫使学生将注意力集中在老师的关键像素和通道上。全局蒸馏重建不同像素之间的关系,并将其从教师传递给学生,以补偿局部蒸馏中丢失的全局信息。由于我

CVPR2022知识蒸馏用于目标检测:Focal and Global Knowledge Distillation for Detectors

论文下载:https://arxiv.org/abs/2111.11837源码下载:https://github.com/yzd-v/FGDAbstract知识蒸馏已成功应用于图像分类。然而目标检测要复杂得多,大多数知识蒸馏方法都失败了。本文指出,在目标检测中,教师和学生的特征在不同的区域有很大的差异,尤其是在前景和背景中。如果我们平均蒸馏它们,特征图之间的不均匀差异将对蒸馏产生负面影响。因此,我们提出了局部和全局蒸馏(FGD)。局部蒸馏分离了前景和背景,迫使学生将注意力集中在老师的关键像素和通道上。全局蒸馏重建不同像素之间的关系,并将其从教师传递给学生,以补偿局部蒸馏中丢失的全局信息。由于我