深度学习入门-学习的技巧（四）超参数

严忻恺

发布时间 2022.02.28阅读数 3059 评论数 0

神经网络中，除了权重和偏置等参数，超参数（hyper-parameter）也经常出现。这里所说的超参数是指，比如各层的神经元数量、batch大小、参数更新时的学习率或权值衰减等。如果这些超参数没有设置合适的值，模型的性能就会很差。

我们使用的数据集分成了训练数据和测试数据，训练数据用于学习，测试数据用于评估泛化能力。由此，就可以评估是否只过度拟合了训练数据（是否发生了过拟合），以及泛化能力如何等。

下面我们要对超参数设置各种各样的值以进行验证。这里要注意的是，不能使用测试数据评估超参数的性能。这是因为如果使用测试数据调整超参数，超参数的值会对测试数据发生过拟合。

因此，调整超参数时，必须使用超参数专用的确认数据。用于调整超参数的数据，一般称为验证数据（validation data）。我们使用这个验证数据来评估超参数的好坏。

根据不同的数据集，有的会事先分成训练数据、验证数据、测试数据三部分，有的只分成训练数据和测试数据两部分，有的则不进行分割。在这种情况下，用户需要自行进行分割。如果是MNIST数据集，获得验证数据的最简单的方法就是从训练数据中事先分割20%作为验证数据。

接下来我们使用验证数据观察超参数的最优化方法，如下所示。

步骤0

设定超参数的范围。

步骤1

从设定的超参数范围中随机采样。

步骤2

使用步骤1中采样到的超参数的值进行学习，通过验证数据评估识别精度（但是要将epoch设置得很小）。

步骤3

重复步骤1和步骤2（100次等），根据它们的识别精度的结果，缩小超参数的范围。反复进行上述操作，不断缩小超参数的范围，在缩小到一定程度时，从该范围中选出一个超参数的值。这就是进行超参数的最优化的一种方法。

在超参数的最优化中，如果需要更精炼的方法，可以使用贝叶斯最优化（Bayesian optimization）。

人工智能建模仿真机器学习深度学习神经网络

打赏 0

上一篇：深度学习入门-学习的技巧（三）正则化

深度学习入门-学习的技巧（四）超参数

严忻恺

为你推荐

精选【Matlab】复化梯形公式求积分、求二重积分

基于sklearn框架实现线性回归，多项式回归和支持向量机的项目实战

YOLOv5实战之输电线路绝缘子缺陷检测识别

【语义网】【读书笔记】Web 3.0与Semantic Web编程（一）语义Web程序设计简介

Pytorch 6. 使用GPU训练 (Training with GPU)

Python机器学习之k-means聚类算法

关于作者

严忻恺

10

0

0

1

深度学习入门-卷积神经网络（二）池化层

深度学习入门-卷积神经网络（一）卷积层

深度学习入门-学习的技巧（三）正则化

相关推荐

深度强化学习专栏 —— 9. 实现机械臂reach某点之PPO算法实现（三）

轻量级Visual Transformer模型——LeViT(ICCV2021)

当我们在谈论 Deep Learning：CNN 其常见架构（上）

语义SLAM | 深度学习用于特征提取 : SuperPoint（三）

精选数据认知与数据预处理--数据预处理

OpenAI官方提示词课（一）书写提示词的基本原则

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

深度学习入门-学习的技巧（四）超参数

严忻恺

为你推荐

精选【Matlab】复化梯形公式求积分、求二重积分

基于sklearn框架实现线性回归，多项式回归和支持向量机的项目实战

YOLOv5实战之输电线路绝缘子缺陷检测识别

【语义网】【读书笔记】Web 3.0与Semantic Web编程（一）语义Web程序设计简介

Pytorch 6. 使用GPU训练 (Training with GPU)

Python机器学习之k-means聚类算法

评论（0）

关于作者

严忻恺

10

0

0

1

深度学习入门-卷积神经网络（二）池化层

深度学习入门-卷积神经网络（一）卷积层

深度学习入门-学习的技巧（三）正则化

相关推荐

深度强化学习专栏 —— 9. 实现机械臂reach某点之PPO算法实现（三）

轻量级Visual Transformer模型——LeViT(ICCV2021)

当我们在谈论 Deep Learning：CNN 其常见架构（上）

语义SLAM | 深度学习用于特征提取 : SuperPoint（三）

精选数据认知与数据预处理--数据预处理

OpenAI官方提示词课（一）书写提示词的基本原则

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板