YOLO-LITE

watersink

发布时间 2022.09.28阅读数 2372 评论数 0

论文：YOLO-LITE: A Real-Time Object Detection Algorithm Optimized for Non-GPU Computers

Github：https://github.com/reu2018DL/YOLO-LITE

论文致力于设计一个网络（cpu速度大于10FPS，PASCAL VOC精度大于30%），因此基于YOLO-v2，提出了一个cpu端的或者端侧的实时检测框架YOLO-LITE。在PASCAL VOC 上取得了33.81%的map，在COCO上取得了12.26%的map，实时性达到了21FPS。

最终识别结果如下，

论文贡献：

(1)贡献了非gpu端的浅层实时检测框架

(2)BatchNorm对于浅层的网络并不需要，虽然可以对精度有1%的提升，使得训练速度也加快，但是缺点是带来了参数量的增加，推理速度的延迟。因此对于浅层网络可以尝试去掉BN。

LOSS函数：

SXS:表示yolo中分块的grid数目，横纵各S个，最终形成SxS个grid。

A:每个grid中的预测的边框数目

λcoord ：坐标中心和长宽的系数

λnoobj :预测没有物体的分数的系数

C:预测的有没物体的分数confidence

P(c):分类的类别的分数

1obj ij :预测和groundtruth的IOU大于规定阈值时为1，其他为0

1noobjij: 预测和groundtruth的IOU小于规定阈值时为1，其他为0

整个loss包含了预测的中心坐标的loss，预测边框的宽，高的loss，分类的有物体的loss，没有物体的loss，物体类别的loss。

平均准确性的公式：

P(k) ：在IOU阈值为k时的准确性

∆r(k) ：在IOU阈值为k时的召回率

优化策略：

(1)输入图片的大小

输入图片的大小减半后，会使得推理速度从2.4 FPS增加为6.94 FPS，但是也带来精度的损失，使得精度从 40.48% 降为30.24%。

本论文决定采用精度换取速度的方式，使用输入减半的策略。从yolo-v2的416_416_3的输入变为224_224_3的输入。

(2)Batch Normalization
BN的使用可以有效的缓解covariate shift 和梯度消失的问题，但是带来推理时间的增加。

本论文决定去掉BN层

(3)剪枝Pruning

基于固定阈值的剪枝可以使得AlexNet的参数量减少9倍，VGG的参数量减少13倍，并且对精度的影响很小。基于量化和哈夫曼编码也可以使得参数量减少3-4倍。

但是剪枝的策略对于YOLO-LITE在精度和速度上都没有提升。主要因为剪枝可能对全连接层更加有效。而YOLO-LITE大部分是卷积层。

实验验证：

如上表所示，论文进行了13次的不同结构的实验。能满足精度30%+，速度20+map的只有Trial 3（NB）。因此Trial 3（NB）是本文最终的模型，即tiny-yolov2-trial13_noBatch，大小为84M。

与Tiny-YOLO v2的区别在于，

(1)去掉BN

(2)前4层保持不变，第5层有128个通道（3_3），第6层有128个通道（3_3），第7层256个通道（3_3），第8层125个通道（1_1）

实验运行：

这里使用的yolo-v3的程序进行的测试。

git clone https://github.com/pjreddie/darknet
cd darknet
Make -j32
git clone https://github.com/reu2018DL/YOLO-LITE.git
./darknet detect ./YOLO-LITE/cfg/tiny-yolov2-trial3-noBatch.cfg ./YOLO-LITE/weights/tiny-yolov2-trial3-noBatch.weights data/dog.jpg

总结：

提出了一个yolo-v2的轻量化版本YOLO-LITE，在速度和精度之间做了权衡。最终速度为21FPS，VOC精度为33.77%

机器学习 YOLO 深度学习目标识别 BP神经网络

打赏 0

上一篇：多目标跟踪之LightTrack

下一篇：IoU-Net

YOLO-LITE

watersink

为你推荐

精选DI-engine强化学习入门（二）如何训练和导出模型

CNN基本步骤以及经典卷积(LeNet、AlexNet、VGGNet、InceptionNet 和 ResNet)网络讲解以及tensorflow代码实现

语义SLAM | 深度学习用于特征提取 : GCN-SLAM（二）

Machine Learning-L0-机器学习简介

【深度学习】经典网络-Alexnet复现(使用Tensorflow实现)

为什么两层33卷积核效果比1层55卷积核效果要好？

关于作者

watersink

50

0

0

4

Anchor Free，框即是点，CenterNet

Fine-Grained Classification之车型识别

基于多输出顺序回归的年龄识别

相关推荐

精选【技术分享】使用YOLOv4跑通VOC官方数据集

【强化学习】揭开PPO2算法的神秘面纱（一）

在Jetson Nano安装测试YOLO v5目标识别示例

[BPnet识别MNIST04]神经网络的变量和公式分析

pybullet杂谈：使用深度学习拟合相机坐标系与世界坐标系坐标变换关系（一）

机器学习分类模型的评估指标

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

YOLO-LITE

watersink

为你推荐

精选DI-engine强化学习入门（二）如何训练和导出模型

CNN基本步骤以及经典卷积(LeNet、AlexNet、VGGNet、InceptionNet 和 ResNet)网络讲解以及tensorflow代码实现

语义SLAM | 深度学习用于特征提取 : GCN-SLAM（二）

Machine Learning-L0-机器学习简介

【深度学习】经典网络-Alexnet复现(使用Tensorflow实现)

为什么两层3*3卷积核效果比1层5*5卷积核效果要好？

评论（0）

关于作者

watersink

50

0

0

4

Anchor Free，框即是点，CenterNet

Fine-Grained Classification之车型识别

基于多输出顺序回归的年龄识别

相关推荐

精选【技术分享】使用YOLOv4跑通VOC官方数据集

【强化学习】揭开PPO2算法的神秘面纱（一）

在Jetson Nano安装测试YOLO v5目标识别示例

[BPnet识别MNIST04]神经网络的变量和公式分析

pybullet杂谈 ：使用深度学习拟合相机坐标系与世界坐标系坐标变换关系（一）

机器学习分类模型的评估指标

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

为什么两层33卷积核效果比1层55卷积核效果要好？

pybullet杂谈：使用深度学习拟合相机坐标系与世界坐标系坐标变换关系（一）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板