【YOLOv7/YOLOv5系列算法改进NO.37】结合CVPR2022新作ConvNeXt网络

人工智能算法研究院 2023-04-11 原文

前言：作为当前先进的深度学习目标检测算法YOLOv7，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，将重点对YOLOv7的如何改进进行详细的介绍，目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv7，YOLOv5算法2020年至今已经涌现出大量改进论文，这个不论对于搞科研的同学或者已经工作的朋友来说，研究的价值和新颖度都不太够了，为与时俱进，以后改进算法以YOLOv7为基础，此前YOLOv5改进方法在YOLOv7同样适用，所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。

具体改进办法请关注后私信留言！关注免费领取深度学习算法学习资料！

解决问题：之前改进增加了很多注意力机制的方法，包括比较常规的SE、CBAM等，本文加入基于MLP的注意力机制，该注意力机制了保留通道和空间方面的信息以增强跨维度交互的重要性。因此，我们提出了一种全局调度机制，通过减少信息缩减和放大全局交互表示来提高深度神经网络的性能，提高检测效果。

基本原理：

视觉识别的“咆哮的20年代”始于视觉变形金刚（ViTs）的引入，它迅速取代ConvNets成为最先进的图像分类模型。另一方面，普通的ViT在应用于诸如对象检测和语义分割等一般计算机视觉任务时面临困难。正是分层的变形金刚（例如Swin Transformers）重新引入了几个ConvNet先验，使变形金金刚作为通用视觉骨干切实可行，并在各种视觉任务中表现出色。然而，这种混合方法的有效性仍然很大程度上归功于变压器的固有优势，而不是卷积的固有电感偏差。在这项工作中，我们重新审视了设计空间，并测试了纯ConvNet所能达到的极限。我们逐渐将标准的ResNet“现代化”为视觉变换器的设计，并发现了一些关键组件，这些组件在设计过程中会产生性能差异。这一探索的结果是一系列被称为Con-vNeXt的纯ConvNet模型。ConvNeXts完全由标准ConvNet模块构建，在准确性和可扩展性方面与Transformers竞争激烈，实现了87.8%的ImageNet顶级精度，在COCO检测和ADE20K分割方面优于Swin Transformers，同时保持了标准ConvNet的简单性和效率。

我们在表（下图）中展示了从ImageNet-22K预训练微调的模型的结果。这些实验很重要，因为人们普遍认为，视觉变形金刚具有较少的感应偏差，因此在更大规模的预训练时，其表现比ConvNets更好。我们的结果表明，当使用大数据集进行预训练时，设计得当的ConvNets并不比视觉变形金刚差-ConvNeXts的性能仍与同类尺寸的SwinTransformers相当或更好，吞吐量略高。此外，我们的ConvNeXt XL模型达到了87.8%的精度，比ConvNeXt-L的3842精度有了相当大的提高，表明ConvNeX是可扩展的架构。在ImageNet-1K、EfficientNetV2-L上，一个配备了高级模块（如挤压和激励[35]）和渐进式训练程序的搜索架构实现了最佳性能。然而，通过ImageNet-22K预训练，ConvNeXt能够超越EfficientNetV2，进一步证明了大规模训练的重要性。在附录B中，我们讨论了ConvNeXt的鲁棒性和域外泛化结果。

添加方法：

第一步：确定添加的位置，作为即插即用的注意力模块，可以添加到YOLOv7网络中的任何地方。

第二步：common.py构建模块。部分代码如下，关注文章末尾，私信后领取。

class CNeB(nn.Module):
    # CSP ConvNextBlock with 3 convolutions by iscyy/yoloair
    def __init__(self, c1, c2, n=1, shortcut=True, g=1, e=0.5):  # ch_in, ch_out, number, shortcut, groups, expansion
        super().__init__()
        c_ = int(c2 * e)  # hidden channels
        self.cv1 = Conv(c1, c_, 1, 1)
        self.cv2 = Conv(c1, c_, 1, 1)
        self.cv3 = Conv(2 * c_, c2, 1)
        self.m = nn.Sequential(*(ConvNextBlock(c_) for _ in range(n)))

    def forward(self, x):
        return self.cv3(torch.cat((self.m(self.cv1(x)), self.cv2(x)), dim=1))

第三步：yolo.py中注册CNeB模块

 elif m is CNeB:
            c1, c2 = ch[f], args[0]
            if c2 != no:
                c2 = make_divisible(c2 * gw, 8)

            args = [c1, c2, *args[1:]]
            if m is CNeB:
                args.insert(2, n)
                n = 1

第四步：修改yaml文件，本文以修改backbone为例，将原C3模块后加入该模块。

[-1, 1, Conv, [512, 1, 1]],
   [-3, 1, Conv, [512, 1, 1]],
   [-1, 1, Conv, [512, 3, 2]],
   [[-1, -3], 1, Concat, [1]],
   [-1, 1, CNeB, [1024]],
   [-1, 1, Conv, [256, 3, 1]],
  ]

第五步：将train.py中改为本文的yaml文件即可，开始训练。

结果：本人在遥感数据集上进行实验，有涨点效果。需要请关注留言。

预告一下：下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我，有问题可以留言或者私聊我哦

PS：该方法不仅仅是适用改进YOLOv5，也可以改进其他的YOLO网络以及目标检测网络，比如YOLOv7、v6、v4、v3，Faster rcnn ，ssd等。

最后，有需要的请关注私信我吧。关注免费领取深度学习算法学习资料！

有关【YOLOv7/YOLOv5系列算法改进NO.37】结合CVPR2022新作ConvNeXt网络的更多相关文章

ruby-on-rails - rspec - 我怎样才能让 "pendings"有我的文本而不仅仅是 "No reason given" - 2
我有这个代码:context"Visitingtheusers#indexpage."dobefore(:each){visitusers_path}subject{page}pending('iii'){shouldhave_no_css('table#users')}pending{shouldhavecontent('Youhavereachedthispageduetoapermissionic错误')}它会导致几个待处理，例如ManagingUsersGivenapractitionerloggedin.Visitingtheusers#indexpage.#Noreason
ruby-on-rails - Rails - Carrierwave 进程抛出 ArgumentError : no images in this image list - 2
在尝试实现应用auto_orient的过程之后!对于我的图片，我收到此错误:ArgumentError(noimagesinthisimagelist):app/uploaders/image_uploader.rb:36:in`fix_exif_rotation'app/controllers/posts_controller.rb:12:in`create'Carrierwave在没有进程的情况下工作正常，但在添加进程后尝试上传图像时抛出错误。流程如下:process:fix_exif_rotationdeffix_exif_rotationmanipulate!do|image|
ruby-on-rails - 我可以用鸭子类型(duck typing)改进这种方法吗？ - 2
希望我没有误解“ducktyping”的含义，但从我读到的内容来看，这意味着我应该根据对象如何响应方法而不是它是什么类型/类来编写代码。代码如下:defconvert_hash(hash)ifhash.keys.all?{|k|k.is_a?(Integer)}returnhashelsifhash.keys.all?{|k|k.is_a?(Property)}new_hash={}hash.each_pair{|k,v|new_hash[k.id]=v}returnnew_hashelseraise"CustomattributekeysshouldbeID'sorPropertyo
映宇宙2022年营收63亿元：同比下降三成，毛利率提升4.3个百分点 - 2
3月26日，映宇宙（HK:03700，即“映客”）发布截至2022年12月31日的2022年度业绩财务报告。财报显示，映宇宙2022年的总营收为63.19亿元，较2021年同期的91.76亿元下降31.1%。2022年，映宇宙的经营亏损为4698.7万元，2021年同期则为净利润4.57亿元；期内亏损（净亏损）为1.68亿元，2021年同期的净利润为4.33亿元；非国际财务报告准则经调整净利润为3.88亿元，2021年同期为4.82亿元，同比下降19.6%。映宇宙在财报中表示，收入减少主要是由于行业竞争加剧，该集团对旗下产品采取更为谨慎的运营策略以应对市场变化。不过，映宇宙的毛利率则有所提升
Ruby gem 安装和 "No such file to load" - 2
我在Backtrack5中使用Ruby1.9.2dev编写脚本，但在尝试使用库“htmlentities”解析html实体时遇到了一些问题。虽然我已经用gem安装了它，但我无法加载它。我将向您展示我在控制台中遇到的问题:root@bt:~#gemlist-dhtmlentities***LOCALGEMS***htmlentities(4.3.1)Author:PaulBattleyHomepage:https://github.com/threedaymonk/htmlentitiesInstalledat:/var/lib/gems/1.9.2Amoduleforencodinga
ruby - 杰基尔服务错误 : no implicit conversion of nil into String - 2
我用这个错误搜索了jekyll。jekyll处理页面时似乎出现了ruby错误，但我根本不了解ruby。杰基尔版本1.3.1我什至重新安装了ruby和jekyll，但结果没有改变。更新:在我将jekyll从1.31降级到1.20后，这个错误消失了注意:我的网站是用jekyll1.20创建的，所以它不能用1.3.1构建？这是核心问题吗？E:\GitHub\sample>jekyll服务--trace:Configurationfile:E:/GitHub/sample/_config.ymlSource:E:/GitHub/sampleDestination:E:/GitHub
ruby - 无法启动 sinatra 进程 - eventmachine "no acceptor" - 2
我有一个作为守护程序运行的Sinatra应用程序，使用Apache端口转发在端口80和端口7655之间进行调解。这在过去一直运行良好。今天，不太好。我不明白为什么。问题:sudorubymy_process.rb返回:/var/lib/gems/1.9.1/gems/eventmachine-1.0.0/lib/eventmachine.rb:526:in`start_tcp_server':noacceptor(portisinuseorrequiresrootprivileges)(RuntimeError)尝试过:更新所有系统包，更新所有gem。没有帮助(除了来自eventm
ruby - 为什么 Thor 具有 no_tasks 方法？ - 2
或者，更具体地说:我不能只使用私有(private)方法吗？最佳答案据我了解，Thor具有将方法标记为notasks的方法因为方法是任务的概念不同于方法的visibility的概念。.他们需要区分，因为他们从事不同的工作。类Thor的子类的每个方法(独立于其可见性)都被视为任务，除非它被明确标记为无任务。通过控制任务的可见性，您可以控制对该任务的访问，例如如果您将任务设为私有(private)，则它不能被子类调用或直接被用户调用。访问控制不同于某事是否是任务。非任务的方法不能被Thor直接调用，它们不能有options.这里举个
ruby 在 `gem_original_require' : no such file to load -- CloudyScripts (LoadError) - 2
在Ubuntu和Ruby1.8.7上，我通过以下方式安装了CloudyScripts:geminstallgeminstallCloudyScripts当我尝试执行此操作时:require'rubygems'require'CloudyScripts'我收到以下错误:/usr/lib/ruby/1.8/rubygems/custom_require.rb:31:in`gem_original_require':nosuchfiletoload--CloudyScripts(LoadError)from/usr/lib/ruby/1.8/rubygems/custom_require.r
ruby - 环境 : ruby_executable_hooks: No such file or directory - 2
尝试构建SASS时，我在SublimeText2上遇到以下错误。我从这里添加了SASS构建插件https://github.com/jaumefontal/SASS-Build-SublimeText2env:ruby_executable_hooks:没有那个文件或目录[在0.0秒内完成，退出代码为127]不太确定我应该在这里做什么来解决这个问题。谢谢!!反对票的数量告诉我需要添加更多信息。问题是我不太确定应该添加哪些信息。我的SASS.sublime-build文件位于/Library/ApplicationSupport/SublimeText2/Packages/SASSB

【YOLOv7/YOLOv5系列算法改进NO.37】结合CVPR2022新作ConvNeXt网络

有关【YOLOv7/YOLOv5系列算法改进NO.37】结合CVPR2022新作ConvNeXt网络的更多相关文章

随机推荐