经典文献阅读之--BoW3D

敢敢のwings

发布时间 2022.09.19阅读数 5037 评论数 2

0. 简介

相信大家在面试时候经常被问激光SLAM的回环方法。一般我们回答的比较笼统，我们在《SC-LEGO-LOAM 扩展以及深度解析》一文中提到了回环的策略，但是这两年又出来更多的方。相较于16年谷歌提出的《Real-Time Loop Closure in 2D LIDAR SLAM》2D激光雷达算法，最近文章《BoW3D: Bag of Words for Real-time Loop Closing in 3D LiDAR SLAM》就是提出了将词袋模型应用于3D激光雷达中。以实时构建词袋信息，目前作者并未开源代码，但是这并不影响其价值，可以使用视觉类似的词袋方法，不仅能有效地识别再次访问的回路位置，而且还能实时校正全6自由度回路姿态。BoW3D基于3D特征LinK3D构建词包，该特征高效、姿态不变，可用于精确的点对点匹配。

1. 本文贡献

在视觉SLAM领域，已经提出了许多算法来使用图像检索技术。它们通常通过将图像作为文字包（BoW）空间中2D特征的数值向量进行比较来匹配图像。BoW已被证明能够实现非常有效和快速的特征匹配，并促进了视觉SLAM的进展。但是在三维激光雷达SLAM领域，三维激光雷达点云的不规则性、稀疏性和无序性对三维特征提取和表示提出了挑战。在基于3D激光雷达的SLAM中，将3D特征应用于实时闭环和校正全6自由度环路姿态等问题仍然没有解决。

在本文中提出了一种新的闭环方法，该方法为从激光雷达点云提取的三维特征构建一个词包。我们使用LinK3D作为3D点特征，并为名为BoW3D的3D点云提供词袋BoW。在这里插入图片描述同时为了实现快速检索，文中提出了一种基于哈希表的三维特征检索算法。找到匹配后，我们使用RANSAC和SVD的精确点对点LinK3D匹配结果计算全6自由度回路姿态。

提出了一种基于具有3D特征的文字包的完整闭环系统。它建立了LinK3D特征数据库，可以实时有效地识别重访的地点。
所提出的方法还可用于基于LinK3D的匹配结果实时校正全6自由度回路姿态，这使得我们的方法能够与在线操作中的后续回路优化过程一起使用
所提出的方法已嵌入到最先进的激光雷达里程计系统中。实验结果表明，该方法可以显著消除漂移，提高三维激光雷达SLAM系统的精度。

2. 主要内容

2.1 LinK3D特征

BoW3D基于LinK3D特征。LinK3D由三部分组成：关键点提取、描述符生成和特征匹配。如下图所示，LinK3D描述符的核心思想是使用邻域信息表示当前关键点，这是受2D图像特征SIFT和ORB的启发。LinK3D描述符由180维向量表示。描述符的每个维度对应于扇区区域。第一个维度对应于最近关键点所在的扇区区域，其他维度对应于按逆时针顺序排列的区域。LinK3D重量轻，可在32毫秒内构建。此外，LinK3D可用于实现精确的点对点匹配，因此适用于快速3D配准。等这篇代码开源后我们再详细的去看在这里插入图片描述

2.2 词袋模型

在2D图像领域，通过检索2D特征（如SIFT、ORB等），词袋（BoW）用于识别回环的地点。特别是，用于二进制ORB特征的BoW数据库已成功应用于实时位置识别任务。BoW通过从训练图像数据集中提取的一组描述符，在离线步骤中创建一个树结构的视觉词汇表。在处理新图像时，词汇表将提取的图像特征转换为低维向量，包含术语频率和逆文档频率（tf-idf）分数。tf-idf分数由下式计算：

$tf-idf=\frac{n_{w i}}{n_{i}} \log \frac{N}{n_{w}}$

$n\_{wi}$
$n_i$
$N$
$n_w$
$w$ $w$ 的频率越高，表明这个word不适合用来分类。

如果一个词的分数足够高，则计算该词与数据库中的词之间的相似度。如果数据库中有相似的词，则使用反转索引搜索相应的图像。

3. 详细方法

所提出的系统主要由三部分组成。它首先提取原始点云中的LinK3D特征。然后，它使用A-LOAM的里程计和SLAM地图算法来估计机器人姿态。第三部分使用所提出的BoW3D来检测环路闭合并校正环路姿态。如果检测到并优化了环路，则环路闭合将向地图算法提供反馈并更新局部地图，这为后续步骤提供了更精确的姿态。在这里插入图片描述

LinK3D描述符的每个维度代表相应区域中的特定关键点，这使得LinK3D描述符非常具有描述性。因此，我们的方法不需要通过在离线步骤中构建树的方法进行额外转换。因此，我们的BoW3D不需要加载额外的词汇文件，与原始的BoW算法相比，更便于实时位置识别。内存中数据库的结构下图所示，哈希表用于建立单词和单词出现的位置之间的一对一映射。哈希表的计算成本理论上是O(1)的复杂度，这使得它适合于高效检索。BoW3D词汇表中的单词由两部分构成：Dim_value为描述子计算得到的非零数，而Dim_ID为word相对应的维度数。对于每一张图片Place Set中的word集合也包含两种变量：FrameID为第几帧，DesID为一帧画面中的描述子的ID号在这里插入图片描述

3.1 词袋存储

$Th_{f}$ ，则该位置被视为候选位置。此外，为了快速检索，使用反向文档频率（idf）避免检索出现在多个位置的单词。更具体地说，由于这些词明显比其他词出现的频率更高，它们的区分性较差，并且会降低检索效率。因此，我们定义了一个类似于idf的比率因子，以测量当前集合中的位置数与所有集合中的平均值之间的差异。我们使用它来确定在计算位置数时是否应该保留当前单词的位置集。比率定义如下：

$\text{ratio}=N_{\text{set}} / \left(\frac{N}{n_{w}}\right)$

$N_{set}$ $N$ $n_w$ 为总的单词数。如果这个数值高于了阈值那么这个word对应的place set将不会再被计算。流程图如下图所示

在这里插入图片描述

3.2 回环矫正

$T_{l,c}$ $l$ $c$ 之间的相对姿态。

${S}_c$ ${S}_l$ ，我们通过最小化以下成本函数来计算循环：

$\begin{array}{c} r_{l, c}\left(\boldsymbol{R}_{l, c}, \boldsymbol{t}_{l, c}\right)=\frac{1}{2} \sum_{i=1}^{n}\left\|s_{l}^{i}-\left(\boldsymbol{R}_{l, c} s_{c}^{i}+\boldsymbol{t}_{l, c}\right)\right\|^{2} \end{array}$

$l$ $c$ $s$ $R,t$
$\boldsymbol{W} = \sum_{i = 1}^{n} \hat{\boldsymbol{s}}_{l}^{i} \hat{s}_{c}^{i T}$

$W = U\Sigma V^T$

$R_{l,c}=VU^T$

$t_{l,c}=s^, - R_{l,c}s$

$s_ls_c$ $T h_{dis}$ 来确定其有效性。

3.3 更新算法

我们提出了一种向哈希表中添加新词和位置的更新算法。为了提高更新和检索的效率，我们只在哈希表中添加了一定数量的特征。描述子只会基于其对应的关键点与激光雷达中心之间的距离来选择。具体而言，只有特定数量的更接近特征（Na）被添加到哈希表。类似地，当检索循环时，使用一定数量的更接近特征（Nr）进行检索。更新算法如下图所示

在这里插入图片描述

3.4 检测回环

$i$ $j$ 之间的残差定义为：

$\begin{array}{c} r_{i, j}\left(\boldsymbol{T}_{w, i}, \boldsymbol{T}_{w, i}\right)=\ln \left(\boldsymbol{T}_{i, j}^{-1} \boldsymbol{T}_{w, i}^{-1} \boldsymbol{T}_{w, j}\right)^{\vee} \end{array}$

通过最小化以下成本函数，优化顺序边和环闭合边的整个姿态图：

$\begin{array}{c} \min _{T}\left\{\sum_{(i, j) \in S}\left\|r_{i, j}\right\|^{2}+\sum_{(i, j) \in L}\left\|r_{i, j}\right\|^{2}\right\} \end{array}$

$S$ $L$ 是所有环闭合边的集合。我们使用图优化器g2o中实现的Levenberg-Markadt方法来解决优化问题。

姿态优化后，我们更新跟踪线程的局部映射。具体而言，基于当前帧的更新姿态将局部地图中的点投影到全局坐标，这可以确保后续估计的全局一致性。

在这里插入图片描述

4. 参考链接

https://blog.csdn.net/weixin_45485946/article/details/126443177

BoW3D BOW

原创文章作者：敢敢のwings。如若转载，请注明出处：古月居 http://admin.guyuehome.com/39943

打赏 0

上一篇：经典文献阅读之--FEC

下一篇：FAST-LIO2代码解析(五)

经典文献阅读之--BoW3D

敢敢のwings

0. 简介

1. 本文贡献

2. 主要内容

2.1 LinK3D特征

2.2 词袋模型

3. 详细方法

3.1 词袋存储

3.2 回环矫正

3.3 更新算法

3.4 检测回环

4. 参考链接

为你推荐

精选Shell编程的常用知识，看这篇就够了！

经典文献阅读之--FEC

windows/ubuntu下访问Github图像加载失败解决方法

Loam_livox 代码阅读与总结

Keil5安装

精选DRM——学习篇2-2:最简单的DRM应用程序 （single-buffer）

评论（2）

关于作者

敢敢のwings

361

2

802

17

R3LIVE代码详解（二）

Ubuntu环境下ROS安装自己OPENCV版本

zsh安装以及ROS适配

相关推荐

算法基础（三）：链表知识点及题型讲解

【C++ 异步任务 】`std::future`

【PyTorch】nn.MaxPool2d函数详解

一个实例了解自动驾驶路径规划 —— （一）自动泊车实例介绍及A*算法代码分享

Robomaster裁判系统自定义图形界面略述

C++之适配器(Adapter)模式

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

TA的专栏

dlo系列

轨迹规划

大模型

Matlab-ros

深度学习

CUDA

FAST-LIO系列

规范学习

机器人仿真

传感器感知

ROS基础以及进阶

无人驾驶

从零到一的SLAM

机器人基础知识

经典论文阅读

C++模式

专栏导航

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

精选DRM——学习篇2-2:最简单的DRM应用程序（single-buffer）

【C++ 异步任务】`std::future`

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板