精选经典文献阅读之--RigidFusion(动态障碍物SLAM)

敢敢のwings

个人专栏：==顶级==

发布时间 2023.06.13阅读数 1981 评论数 0

0. 简介

在真实的SLAM场景中，我们会发现在遇到大量动态障碍物的场景时候，特别容易造成跟丢的问题。传统的解决方法是通过将动态障碍物滤除，而本文《RigidFusion: Robot Localisation and Mapping in Environments with Large Dynamic Rigid Objects》中提到将动态物体看做刚体进行跟踪。虽然这篇文章创新点并不是很足，但是研究现状总结的很好。目前这篇文章的代码没有开源，但是有视频讲解。文中提出一种新的RGB-D SLAM方法，可以同时分割、跟踪和重建静态背景和可能遮挡相机视野主要部分的大型动态刚性物体。之前的方法将场景的动态部分视为异常值，因此局限于场景中的少量变化，或依赖场景中所有对象的先验信息，以实现鲁棒的摄像机跟踪。本文提出将所有动态部件视为一个刚体，同时分割和跟踪静态和动态部件。因此，在动态对象造成大遮挡的环境中，能够同时定位和重建静态背景和刚性动态组件。

[video(video-tLVSKktU-1666767246055)(type-bilibili)(url-https://player.bilibili.com/player.html?aid=219431753)(image-https://img-blog.csdnimg.cn/img_convert/726e63540c866e806dc9045b2cb0a9b9.jpeg)(title-RigidFusion: Robot Localisation and Mapping inEnvironments with Large Dynamic Ri)]

1. 文章贡献

在无人仓库中搬运和运输物体这些任务需要机器人的移动操作，要求机器人在移动的静态环境中定位，同时对动态物体的干扰具有鲁棒性，并跟踪他们需要操纵的物体。虽然这两个问题之前被单独解决。但是同时解决这两个任务是很少的。

一个新的SLAM框架，使用RGB-D摄像头，在整个SLAM框架中同时分割、跟踪和重建场景，通过具有潜在漂移的运动先验来完成静态背景和一个动态刚体的构建。
使用稠密SLAM建图的方法，对视觉输入中的大型动态遮挡(超过视野的65%)具有鲁棒性。同时该SLAM模型不依赖静态和动态模型的初始化;
提供一个新的RGB-D SLAM数据集，数据集中包括具有在场景中造成大遮挡的动态对象和真实轨迹。

2. 详细内容

本文提出一种SLAM框架，将动态部件视为单个刚体，利用运动先验分割静态部件和动态部件。利用分割后的图像对摄像机进行跟踪，重建背景和目标模型。

下图展示了该方法的重建流程，首先需要连续两个RGBD关键帧A和B，以及静态和动态物体的先验信息，静态和动态物体的先验信息即为\tilde{ξ}_s和\tilde{ξ}_d是属于se(3)的，此外还需要前一帧的语义分割信息\tilde{\Gamma}_A\in \mathbb{R}^{w\times h}。首先根据运动先验信息检测物体是否为动态物体；然后，当物体运动时，基于帧间对齐，我们联合估计分割\tilde{\Gamma}_B和刚体运动\tilde{ξ}_s和\tilde{ξ}_d。这些片段用于重建静态环境和动态对象，并利用帧与模型的对齐实现摄像机的定位。

2.1 图像聚合

类似于文献[4]，每个新的强度和深度图像(I,D) ∈ \mathbb{R}^{W×H}对通过使用K-均值聚类(g K-Means)，被分割成K个几何簇V ={V_i| i = 1,··· ,K}。假设每个簇满足刚性条件，每个刚体可以通过簇的组合来近似。同时文中还为每个集群分配一个分数γ_i ∈ [0,1]表示簇属于静态刚体的概率：γ_i=0表示动态簇，而γ_i=1表示静态簇。对于RGB-D帧A，我们将总体分数表示为γ_A∈ \mathbb{R}^K。

2.2 距离判断

如果两个运动先验之间的差||\tilde{ξ}_s− \tilde{ξ}_d||^2小于阈值\hat{d}，则将图像中的所有聚类视为静态和运动分割。否则，将共同优化当前帧的分数γ_B以及静态和动态刚体的相对运动ξ_s和ξ_d

2.3 图像分割

然后从聚类和分数中计算像素级分割\tilde{\Gamma}_B\in \mathbb{R}^{w\times h}。与静态融合类似，我们从分割中计算静态和动态刚体的加权RGB-D图像\tilde{\Gamma}_B。这些加权图像用于重建背景和动态目标的模型，并通过帧-模型对齐来细化估计的相机姿态(第V节)。

2.4 坐标系转换

我们分别将world- frame、camera- frame和object-frame表示为F_W、F_C、F_O(下图)。与[18]文类似，我们使用T_{XY}∈SE(3)将坐标系F_Y中某个点的齐次坐标转换为F_X。在图像帧A中，相机和物体的姿态分别是T_{WC_A}和T_{WO_A}。考虑两个图像帧A和B， ξ_s与摄像机位姿的关系为:T(ξ_s) = T^{−1}_{WC_A} T_{WC_B} = T_{C_AC_B},这一块就是求得机器人移动的信息， ξ_d与摄像机位姿的关系为:T(ξ_d) = T^{−1}_{WC_A} T_{WO_A}T^{−1}_{WO_B} T_{WC_B} =T_{C_AO_A}T^{-1}_{C_BO_B}，最后就转化为相机和物体的相对运动关系。其中\tilde{ξ}_s和 \tilde{ξ}_d可以由本体感觉传感器提供，如车轮里程计和手臂正向运动学。

在本文中，静态运动先验\tilde{ξ}_s是通过车轮里程计或通过在相机地面真值轨迹上添加模拟漂移来计算的。通过模拟对象真值轨迹上的漂移来生成\tilde{ξ}_d。

3. 参考链接

https://arxiv.org/pdf/2010.10841.pdf

SLAM 动态障碍物

原创文章作者：敢敢のwings。如若转载，请注明出处：古月居 http://admin.guyuehome.com/43436

打赏 0

上一篇：如何快速完成TensorRT模型生成和加速

下一篇：Matlab与ROS---深度学习(九)

精选经典文献阅读之--RigidFusion(动态障碍物SLAM)

敢敢のwings

0. 简介

1. 文章贡献

2. 详细内容

2.1 图像聚合

2.2 距离判断

2.3 图像分割

2.4 坐标系转换

3. 参考链接

为你推荐

KinectFusion原理介绍

Autoware 进行 Robosense-16 线雷达与 ZED 双目相机联合标定！

ubuntu16.04下笔记本自带摄像头编译运行PTAM

精选ROS机器人应用（6）—— 激光雷达建图和导航

如何在移动机器人中部署Gmapping SLAM算法

自动驾驶-激光雷达预处理/特征提取

评论（0）

关于作者

敢敢のwings

366

2

806

17

SC-LEGO-LOAM 扩展以及深度解析（三）

精选如何快速完成TensorRT模型生成和加速

逆透视变换(IPM)多种方式及代码总结

相关推荐

hdl_graph_slam源码解读(三)：点云滤波

机器人学习--ROS/AMCL实现初始化粒子撒满整张地图和分步收敛

精选经典文献阅读之--NoPe-NeRF(优化无位姿先验的神经辐射场)

多传感器融合定位理论基础（四）：IMU内参模型及标定

3D激光雷达SLAM算法学习02——3D激光雷达传感器

hdl_graph_slam源码解读(七)：闭环检测

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

TA的专栏

dlo系列

轨迹规划

大模型

Matlab-ros

深度学习

CUDA

FAST-LIO系列

规范学习

机器人仿真

传感器感知

ROS基础以及进阶

无人驾驶

从零到一的SLAM

机器人基础知识

经典论文阅读

C++模式

专栏导航

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板