年龄识别之ssrnet

watersink

发布时间 2021.08.31阅读数 4265 评论数 0

论文:SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation

Github:https://github.com/shamangary/SSR-Net

IJCAI2018

论文提出了多stage结构的，紧凑，轻量化的年龄识别网络结构SSR-Net（Soft Stagewise Regression Network）。其中，多stage策略（multi-stage strategy），动态区间策略（dynamic range），都有助于模型精度的提升。最终模型大小仅仅0.32M。

问题定义：

N：一共的图片数目

Y：图片的标签

整体的loss为 mean absolute error (MAE)，本质年龄识别问题就是一个回归问题。

DEX方法到多stage策略（Stagewise Regression）：

DEX方法，将整个年龄的回归问题，分解为分类问题。将整个年龄区间 Y = [0; V ] 分解为s个不相交的子区间，每一个子区间的宽度为w

W=v/s

那么第i个子区间ui=i*(V/s)

最终预测的年龄为每一个区间的概率和，即

为了使得模型更加精确，DEX方法设置每一个bin的宽度为1岁，也就是对于 Y = [0::100]，一共有101个bin。

但是这样整，参数量比较大。为了减少最后全连接层的参数量。本文基于DEX方法的基础上，提出了分stage策略。

假设年龄一共0-90岁，区间宽度为10，那么DEX方法的全连接层就需要9个神经元 (0 ∼ 10，10 ∼ 20，20 ∼ 30，30 ∼ 40，40 ∼ 50，50 ∼ 60，60 ∼ 70，70 ∼ 80，80 ∼ 90)。而采用多stage策略后，第一个stage只需要3个神经元 (0 ∼ 30，30 ∼ 60，60 ∼ 90)，第二个stage在第一个stage的基础上，也只需要3个神经元，因为第一层的3个stage共用第二层的3个神经元，即第二层的stage在第一层stage的基础上，只需要区分（小，中，大）就可以实现0-90岁的分类了。2个stage加起来，只需要6个神经元就可以达到。

动态区间（Dynamic Range）：

动态区间就是在原始DEX这种不重叠的区间的基础上，增加一个尺度scale，一个偏移shift，变化为一个动态的区间

∆k为网络输出的结果，1+ ∆k就是偏移shift

w为动态区间的宽度，

η为偏移offset，

最终网络的预测结果就是所有分类预测结果的和，

网络结构：

整个网络结构，输入图片为64*64，网络分为3个stage,整体结构是一个双流类型的结构。

这2个流的区别就是激活函数的区别（RELU vs Tanh），池化的区别（average vs maximum）。

每一个stage之间，都会对双流的输出进行特征融合。然后分别输出3个预测结果，分别是

年龄的分布p，尺度 ∆k，偏移η。

实验结果：

MobileNet，DenseNet，SSR-Net的训练结果，验证结果。SSR-Net的网络拟合能力更好。

SSR-Net的模型更小，精度更高。

结论：

（1）SSR-Net一个实用的年龄预测网络结构。

（2）Stagewise Regression和 Dynamic Range的思想非常值得借鉴。
————————————————

神经网络经验分享年龄识别 SSR-Net

打赏 0

上一篇：人脸表情识别调研

下一篇：高IOU遮挡下的姿态估计（HintPose）

年龄识别之ssrnet

watersink

为你推荐

飞桨学习——paddle.nn.Flatten

NanoDet代码逐行精读与修改（五.2）计算Loss

一次可预测多张图片

（九）演员-评论员算法

强化学习基础 Ⅴ: Q learning 原理与实战

精选COLMAP多视角视图数据可视化

关于作者

watersink

50

0

0

4

度量学习之人脸识别算法总结

opencv跟踪（BOOSTING, MIL, KCF,TLD, MEDIANFLOW, GOTURN, MOSSE, CSRT）

姿态估计之CPN(Cascaded Pyramid Network)

相关推荐

搭建复杂神经网络同时优化参数

斯坦福深度学习课程cs231n assignment2作业笔记五：Batch Normalization（以及Layer Normalization）

实例分割之YOLACT（You Only Look At CoefficienTs）

精选工具推荐-Colab介绍与使用方法

强化学习入门项目 Spinning up OpenAI (5) 关于policy gradient的基础

运行基于MindSpore的yolov5流程记录

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

年龄识别之ssrnet

watersink

为你推荐

飞桨学习——paddle.nn.Flatten

NanoDet代码逐行精读与修改（五.2）计算Loss

一次可预测多张图片

（九）演员-评论员算法

强化学习基础 Ⅴ: Q learning 原理与实战

精选COLMAP多视角视图数据可视化

评论（0）

关于作者

watersink

50

0

0

4

度量学习之人脸识别算法总结

opencv跟踪（BOOSTING, MIL, KCF,TLD, MEDIANFLOW, GOTURN, MOSSE, CSRT）

姿态估计之CPN(Cascaded Pyramid Network)

相关推荐

搭建复杂神经网络同时优化参数

斯坦福深度学习课程cs231n assignment2作业笔记五：Batch Normalization（以及Layer Normalization）

实例分割之YOLACT（You Only Look At CoefficienTs）

精选工具推荐-Colab介绍与使用方法

强化学习入门项目 Spinning up OpenAI (5) 关于policy gradient的基础

运行基于MindSpore的yolov5流程记录

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板