【PyTorch】nn.Conv2d函数详解

望天边星宿

发布时间 2023.12.16阅读数 680 评论数 0

文章目录

1. 函数语法格式

torch.nn.Conv2d(
	in_channels, 
	out_channels, 
	kernel_size, 
	stride=1, 
	padding=0, 
	dilation=1, 
	groups=1, 
	bias=True, 
	padding_mode='zeros', 
	device=None, 
	dtype=None
)

2. 参数解释

in_channels：输入的通道数，RGB 图像的输入通道数为 3
out_channels：输出的通道数
kernel_size：卷积核的大小，一般我们会使用 5x5、3x3 这种左右两个数相同的卷积核，因此这种情况只需要写 kernel_size = 5这样的就行了。如果左右两个数不同，比如3x5的卷积核，那么写作kernel_size = (3, 5)，注意需要写一个 tuple，而不能写一个 list。
stride = 1：卷积核在图像窗口上每次平移的间隔，即所谓的步长。
padding：指图像填充，后面的int型常数代表填充的多少（行数、列数），默认为0。需要注意的是这里的填充包括图像的上下左右，以padding=1为例，若原始图像大小为[32, 32]，那么padding后的图像大小就变成了[34, 34]
dilation：是否采用空洞卷积，默认为1（不采用）。从中文上来讲，这个参数的意义从卷积核上的一个参数到另一个参数需要走过的距离，那当然默认是1了，毕竟不可能两个不同的参数占同一个地方吧（为0）。更形象和直观的图示可以观察Github上的Dilated convolution animations，展示了dilation=2的情况。
groups：决定了是否采用分组卷积，groups参数可以参考groups参数详解
bias：即是否要添加偏置参数作为可学习参数的一个，默认为True。
padding_mode：即padding的模式，默认采用零填充。

3. 尺寸关系

在这段函数中，输入为 $N,C_{in},H,W)$ ，输出为 $(N, C_{o u t}, H_{o u t}, W_{o u t})$ ，它们的关系为：

其中 N 为 batch size，C 为输入通道数，H 为图像高，W 为图像宽。

输入可以为： $N,C_{in},H_{in},W_{in})$ 或 $C_{in},H_{in},W_{in})$
输出可以为： $N,C_{out},H_{out},W_{out})$ 或 $C_{out},H_{out},W_{out})$

它们之间的关系为：

4. 使用案例

# With square kernels and equal stride
m = nn.Conv2d(16, 33, 3, stride=2)
# non-square kernels and unequal stride and with padding
m = nn.Conv2d(16, 33, (3, 5), stride=(2, 1), padding=(4, 2))
# non-square kernels and unequal stride and with padding and dilation
m = nn.Conv2d(16, 33, (3, 5), stride=(2, 1), padding=(4, 2), dilation=(3, 1))
input = torch.randn(20, 16, 50, 100)
output = m(input)

5. nn.functional.conv2d

官网链接

⭐ 区别

torch.nn.Conv2d 和 torch.nn.functional.conv2d，在 pytorch 构建模型中，都可以作为二维卷积的引入，但前者为类模块，后者为函数，在使用上存在不同。

⭐ 使用

torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1)

深度学习 Python Pytorch 计算机视觉函数详解

转载原出处：

打赏 0

上一篇：【Python】使用VTK实现3D可视化医学图像（格式.nii.gz）

下一篇：ITK-SNAP使用笔记

【PyTorch】nn.Conv2d函数详解

望天边星宿

1. 函数语法格式

2. 参数解释

3. 尺寸关系

4. 使用案例

5. nn.functional.conv2d

为你推荐

精选MQTT传输JSON数据实例

精选Pytorch :如何把print的参数存起来？

【Linux内核三】网络丢包debug案例

本地环境下同步多设备时间

精选基于运动目标控制与自动追踪系统的pid算法简单实现（一）

模式识别实现之人脸识别（matlab）

关于作者

望天边星宿

36

0

550

2

分割常用的评价指标

【目标检测】keras-yolo3-tiny训练自己的数据集（目标：人&车辆）

【TensorFlow】Window10搭建GPU环境（CUDA、cuDNN）

相关推荐

在云服务器上基于docker安装jenkins

【Ubuntu18.04】将AppImage软件加入收藏夹、添加到dock并添加icon

gcc与g++的安装升级，版本不一致等问题的解决

树莓派配置frp实现内网穿透远程ssh连接

械臂论文笔记（三）【抓取检测】机器人抓取检测技术的研究现状刘亚欣

基于传统方法的单目深度估计

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

【PyTorch】nn.Conv2d函数详解

望天边星宿

1. 函数语法格式

2. 参数解释

3. 尺寸关系

4. 使用案例

5. nn.functional.conv2d

为你推荐

精选MQTT传输JSON数据实例

精选Pytorch :如何把print的参数存起来？

【Linux内核三】网络丢包debug案例

本地环境下同步多设备时间

精选基于运动目标控制与自动追踪系统的pid算法简单实现（一）

模式识别实现之人脸识别（matlab）

评论（0）

关于作者

望天边星宿

36

0

550

2

分割常用的评价指标

【目标检测】keras-yolo3-tiny训练自己的数据集（目标：人&车辆）

【TensorFlow】Window10搭建GPU环境（CUDA、cuDNN）

相关推荐

在云服务器上基于docker安装jenkins

【Ubuntu18.04】将AppImage软件加入收藏夹、添加到dock并添加icon

gcc与g++的安装升级，版本不一致等问题的解决

树莓派配置frp实现内网穿透远程ssh连接

械臂论文笔记（三）【抓取检测】机器人抓取检测技术的研究现状 刘亚欣

基于传统方法的单目深度估计

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

械臂论文笔记（三）【抓取检测】机器人抓取检测技术的研究现状刘亚欣

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板