(RAL2023)摘要 本文介绍了一种利用点和线特征的高效视觉惯性同步定位和映射(SLAM)方法。目前,基于点的SLAM方法在弱纹理和运动模糊等场景下表现不佳。许多研究者注意到线特征在空间中的优异特性,并尝试开发基于线的SLAM系统。然而,线条提取和描述匹配过程的计算量巨大,难以保证整个SLAM系统的实时性,而错误的线条检测和匹配限制了SLAM系统性能的提高。本文通过短线融合、线特征均匀分布、自适应阈值提取等方法对传统的线检测模型进行改进,获得用于构建SLAM约束的高质量线特征。基于灰度不变性假设和共线性约束,提出了一种线光流跟踪方法,显著提高了线特征匹配速度。此外,提出了一种独立于线端
论文地址(CVPR2020)《MonoPair:Monocular3DObjectDetectionUsingPairwiseSpatialRelationships》目录《MonoPair:Monocular3DObjectDetectionUsingPairwiseSpatialRelationships》0摘要1简介2相关工作3方法3.1总览3.2二维检测3.3三维检测3.4成对空间约束3.5不确定性3.6空间约束优化4实验0摘要单目三维目标检测是自动驾驶中的一个重要组成部分,也是一项具有挑战性的问题,特别是对于那些只有部分可见的遮挡样本。大多数检测器将每个三维物体视为独立的训练目标,这
基于扩散模型的单目深度估计论文链接:https://arxiv.org/abs/2302.14816论文项目地址:DepthGen出处:CVPR20231.摘要作者受高保真图像生成方面取得成功的启发,使用【去噪扩散模型】来进行单目深度估计。方法:具体地,引入了新的方法来解决训练数据中由于噪声、不完整的深度图而产生的问题,包括分步去噪扩散、L1损失和训练过程中的深度填充。为了应对监督训练数据的有限可用性,作者在自监督的图到图翻译任务上使用预训练。效果:通过一个通用的损失和架构,论文的DepthGen模型在室内NYU数据集上取得了SOTA性能,在室外KITTI数据集上也取得了接近SOTA的结果。此
0.简介对于单目摄像头完成SLAM建图这类操作,对于自动驾驶行业非常重要,《OnlineMonocularLaneMappingUsingCatmull-RomSpline》介绍了一种仅依靠单个摄像头和里程计生成基于样条的在线单目车道建图方法。我们提出的技术将车道关联过程建模为一个二分图的分配问题,并通过结合Chamfer距离、姿态不确定性和横向序列一致性为边赋予权重。此外,文中还精心设计了控制点初始化、样条参数化和优化,以逐步创建、扩展和精化样条。相关的代码已经在Github上开源了。1.主要贡献基于Catmull-Rom样条表示,设计了一个完整的在线车道建图系统,如图1所示。所提出的系统允
论文地址(CVPR2021)代码实现(PyTorch版)《M3DSSD:Monocular3DSingleStageObjectDetector》目录《M3DSSD:Monocular3DSingleStageObjectDetector》0摘要1简介2相关工作3方法3.1骨干网络3.2特征对齐模块3.3非对称非局部注意力块3.42D-3D检测和损失4实验0摘要本文提出一种带有特征对齐及非对称非局部注意力机制的单目三维单阶段目标检测器(Monocular3DSingleStageobjectDetector,M3DSSD)。现有的anchor-based单目三维目标检测方法存在特征不匹配的问题
传统的深度估计方法通常是使用双目相机,计算两个2D图像的视差,然后通过立体匹配和三角剖分得到深度图。然而,双目深度估计方法至少需要两个固定的摄像机,当场景的纹理较少或者没有纹理的时候,很难从图像中捕捉足够的特征来匹配。所以最近单目深度估计发展的越来越快,但是由于单目图像缺乏可靠的立体视觉关系,因此在三维空间中回归深度本质上是一种不适定问题。单目图像采用二维形式来重新反射三维世界,然而,有一维场景叫做深度丢失了,导致无法判断物体的大小和距离,也不能判断物体是否被其它物体遮挡,所以,我们需要恢复单目图像的深度。基于深度图,我们可以判断物体大小和距离,以满足场景理解的需要。当估计的深度图能够反应场景
参考代码:LATR动机与主要工作:之前的3D车道线检测算法使用诸如IPM投影、3Danchor加NMS后处理等操作处理车道线检测,但这些操作或多或少会存在一些负面效应。IPM投影对深度估计和相机内外参数精度有要求,anchor的方式需要一些如NMS的后处理辅助。这篇文章主要的贡献有两点:1)针对车道线的特性基于DETR目标检测算法提出了一种基于landlinequery的检测方法,为了使得query的初始化更合理借鉴了SparseInst方法从2D图像域中用不同实例来初始化query,并且建立车道线query的粒度不是车道线级别而是具体到了车道线上的点。2)用图像特征作为key和val是较难去
基本信息题目:MonocularArbitraryMovingObjectDiscoveryandSegmentation作者:来源:BMVC时间:2021代码地址:https://github.com/michalneoral/RaptorAbstract我们提出了一种发现和分割场景中独立移动的物体或其部分的方法。给定三个单眼视频帧,该方法输出语义上有意义的区域,即对应于整个对象的区域,即使只有其中一部分移动。基于CNN的端到端方法的架构称为Raptor,它结合了语义和运动主干,将其输出传递到最终的区域分割网络。语义主干以与类无关的方式进行训练,以便泛化到训练数据之外的对象类。运动分支的核心
论文信息标题:OnMovingObjectSegmentationfromMonocularVideowithTransformers作者:来源:ICCV时间:2023代码地址:暂无Abstract通过单个移动摄像机进行移动对象检测和分割是一项具有挑战性的任务,需要了解识别、运动和3D几何。将识别和重建结合起来可以归结为融合问题,其中需要结合外观和运动特征来进行分类和分割。在本文中,我们提出了一种用于单目运动分割的新颖融合架构-M3Former,它利用Transformer的强大性能进行分割和多模态融合。由于从单目视频重建运动是不适定的,我们系统地分析了该问题的不同2D和3D运动表示及其对分割
文章目录论文精读摘要(Abstract)1.介绍(Introduction)2.相关工作(RelatedWork)3.方法(Approach)3.1框架总览(FrameworkOverview)3.22D引导的多层次3D预测(2DGuidedMulti-Level3DPrediction)3.3二维高斯分布的三维中心度(3DCenter-nesswith2DGaussianDistribution)论文精读摘要(Abstract)单目三维目标检测具有成本低的优点,是自动驾驶的一项重要任务。由于其固有的不适定特性,其主要表现为缺乏深度信息,因而比传统的二维情形更具挑战性。二维检测的最新进展为更好