torch.nn.functional.grid_sample（F.grid_sample）函数的说明 & 3D空间中的点向图像投影的易错点

byzy

分类：机器视觉

发布时间 2023.04.27阅读数 2231 评论数 0

由于二者有一定共通之处，因此放在一篇文章内介绍。

1. 关于torch.nn.functional.grid_sample函数的说明（F.grid_sample）

该函数的作用是在图像/体素空间中采样特征。

1.1 输入和输出：

1.2 需要注意的地方

以4维输入（即从图像采样特征）为例，设图像的大小为(H,W)。

当align_corner=False时，函数会将像素视为方块，并以图像左上角像素的左上角为原点建立坐标系（如下左图所示）；否则函数会将像素视为点，以图像左上角像素（中心）为原点建立坐标系（如下右图所示）。

参数grid的元素需主要分布在[−1,1]内，表示归一化采样坐标。其中−1表示图像范围内的最小坐标，而1表示图像范围内的最大坐标（如上图所示）。
参数grid中的最后一维的顺序为(x,y)，但输入图像大小(H,W)对应(y_size,x_size)。例子如下：

a = torch.arange(12, dtype=torch.float).reshape(3,4).unsqueeze(0).unsqueeze(0)  # (1,1,3,4)
grid = torch.tensor([[[-0.25,-1.0], [1.0,-1.0]],
                     [[-1.0, 1.0], [1.0, 1.0]]]).unsqueeze(0)					# (1,2,2,2)
out = F.grid_sample(a, grid=grid, padding_mode='border')						# (1,1,2,2)
# 输出a：
# tensor([[[[ 0.,  1.,  2.,  3.],
#           [ 4.,  5.,  6.,  7.],
#           [ 8.,  9., 10., 11.]]]])
# 输出out：
# tensor([[[[ 1.,  3.],
#           [ 8., 11.]]]])
# 我们只关注采样的左上角元素，坐标为(-0.25,-1.0)，对应上左图中的第一行第二个格子的顶部中心，
# 在双线性插值、边界值填充的情况下采样特征就是该像素的特征1。

对于5维输入（即从体素空间采样特征）的情况，参数grid中的最后一维顺序为(x,y,z)，但输入体素空间大小(D,H,W)对应(z_size,y_size,x_size)。例子如下：

a = torch.arange(12, dtype=torch.float).reshape(3,4).unsqueeze(0).unsqueeze(0)  # (1,1,3,4)
grid = torch.tensor([[[[-0.25, -1.0, -1.0], [1.0, -1.0, -1.0]],
                      [[ -1.0,  1.0,  1.0], [1.0,  1.0,  1.0]]]]).unsqueeze(0)	# (1,1,2,2,3)
out = F.grid_sample(a, grid=grid, padding_mode='border')						# (1,1,1,2,2)
# 输出a：
# tensor([[[[[ 0.,  1.,  2.,  3.],
#            [ 4.,  5.,  6.,  7.],
#            [ 8.,  9., 10., 11.]],		# 第一层
# 
#           [[12., 13., 14., 15.],
#            [16., 17., 18., 19.],
#            [20., 21., 22., 23.]]]]])	# 第二层
# 输出out：
# tensor([[[[[ 1.,  3.],
#            [20., 23.]]]]])
# 我们只关注采样的左上角元素，前两个维度的坐标为(-0.25,-1.0)，对应上左图中的第一行第二个格子的顶部中心；
# 而第三个维度的坐标为-1.0，对应最上层的最上部（自行想象3D体素空间）。在双线性插值、边界值填充的情况下，
# 采样特征就是该体素（最上层、第一行第二个体素）的特征1。

2. 3D空间中的点向图像投影时的易错点

2.1 点向图像的投影

设图像的内参矩阵（3×4）扩维为4×4后的矩阵为I，相机坐标系中的点（3维）扩维到4维后的向量为p=(x,y,z,1) T
，图像坐标系下的像素索引（可为小数）为(u,v)，深度为d，则

(ud,vd,d,1)T=I⋅p

2.2 易错点：小数索引转换为整数索引（寻找对应的像素）

下图所示为上述(u,v)被定义的坐标系以及像素的整数索引。

可见，应该对小数索引进行floor()操作，以找到其对应像素的整数索引。

机器视觉图像处理图像投影

打赏 0

上一篇：5种3D Attention/Transformer整理（A-SCN、Point Attention、CAA、Offset Attention、Point Transformer）

下一篇：BEVDepth: Acquisition of Reliable Depth for Multi-view 3D Object Detection 论文笔记

torch.nn.functional.grid_sample（F.grid_sample）函数的说明 & 3D空间中的点向图像投影的易错点

byzy

1. 关于torch.nn.functional.grid_sample函数的说明（F.grid_sample）

1.1 输入和输出：

1.2 需要注意的地方

2. 3D空间中的点向图像投影时的易错点

2.1 点向图像的投影

2.2 易错点：小数索引转换为整数索引（寻找对应的像素）

为你推荐

基于视觉的机械臂分拣（二）

YoloV5实战：手把手教物体检测——YoloV5

PCL库学习笔记——入门、基本的数据结构

OpenCV—数字水印(基于Python)

精选霍夫变换椭圆检测（matlab仿真与图像处理系列第2期）

我与Robot有个约会——扩展卡尔曼滤波定位

关于作者

byzy

31

0

0

2

测试时数据增广（TTA）与mmdetection3d中的实现

激光雷达3D目标检测方法论文笔记A Survey of Robust LiDAR-based 3D Object Detection Methods for Autonomous Driving

复制粘贴数据增广/GT增广与mmdetection3d中的实现（dbsample）

相关推荐

Opencv3从头开始（五）形态学操作之膨胀、腐蚀、开闭运算

目标检测入门之再读YOLOv4(一)

目标检测(MMdetection)-Runner

OpenCV学习+常用函数记录③：霍夫变换与轮廓提取

【数字图像处理基础算法】

ValueError: cannot reshape array of size xxx into shape (xxx,xxx,xxx)解决方法

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

torch.nn.functional.grid_sample（F.grid_sample）函数的说明 & 3D空间中的点向图像投影的易错点

byzy

1. 关于torch.nn.functional.grid_sample函数的说明（F.grid_sample）

1.1 输入和输出：

1.2 需要注意的地方

2. 3D空间中的点向图像投影时的易错点

2.1 点向图像的投影

2.2 易错点：小数索引转换为整数索引（寻找对应的像素）

为你推荐

基于视觉的机械臂分拣（二）

YoloV5实战：手把手教物体检测——YoloV5

PCL库学习笔记——入门、基本的数据结构

OpenCV—数字水印(基于Python)

精选霍夫变换椭圆检测（matlab仿真与图像处理系列第2期）

我与Robot有个约会——扩展卡尔曼滤波定位

评论（0）

关于作者

byzy

31

0

0

2

测试时数据增广（TTA）与mmdetection3d中的实现

激光雷达3D目标检测方法论文笔记A Survey of Robust LiDAR-based 3D Object Detection Methods for Autonomous Driving

复制粘贴数据增广/GT增广与mmdetection3d中的实现（dbsample）

相关推荐

Opencv3从头开始（五）形态学操作之膨胀、腐蚀、开闭运算

目标检测入门之再读YOLOv4(一)

目标检测(MMdetection)-Runner

OpenCV学习+常用函数记录③：霍夫变换与轮廓提取

【数字图像处理基础算法】

ValueError: cannot reshape array of size xxx into shape (xxx,xxx,xxx)解决方法

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板