AutoFocusFormer

突破经典网格特征？AutoFocusFormer: Image Segmentation off the Grid 论文阅读笔记

突破经典网格特征？AutoFocusFormer:ImageSegmentationofftheGrid论文阅读笔记一、Abstract二、引言三、相关工作视觉TransformerBackbones基于聚类的注意力自适应下采样点云网络四、方法4.1聚类和区域4.1.1平衡聚类4.1.2聚类的区域写在前面这一周赶上五一五天假了，朋友们出去happy了吗？有没有赶上人山人海的热闹？反正我只是在5.1那天出去走走，哈哈。这是一篇关于实例分割的文章，所解决的问题在于实例分割中需要的小目标像素分辨率太低，于是本文提出一种自适应下采样的方法来解决这一之前没有人想到要做的隐藏问题。论文地址：Aut

苹果、俄勒冈州立提出AutoFocusFormer: 摆脱传统栅格，采用自适应下采样的图像分割

传统RGB图像以栅格（raster）形式储存，像素点的分布在整个图像上均匀统一。然而，这种均匀分布往往与图像实际内容的密度分布相去甚远。尤其是在现今常用的深度网络中，在编码部分经过频繁的下采样（downsampling）后，小物体占据的点极少，而大物体占据的点很多。如下图中，背景中繁忙的人群只剩下极少量的点表示，而画面下方大量的点被信息量极低的地面占用。如果从存储的特征个数和算力的角度来考虑这个图像识别的过程，那么可以想见地面特征被大量的存储，大部分的算力被用来计算这些地面。而真正关键的人群，由于点少，分到的特征就少，用于计算的算力也就很少。图片由于没有足够的点来描述不同小物体的特征，导致深度