[BPnet识别MNIST06]发散的误差函数

worker

分类：机器学习

发布时间 2021.08.02阅读数 3483 评论数 0

写在前面

很遗憾，今天并没有取得什么实质性的进展，并且我还切实的感受到了误差函数发散的快感，今天这篇文章主要分享我的实现代码思路以及往期博客的一些纠正。

公式纠正

首先是对我上一篇博客中一个错误公式的纠正，错误公式如下图所示：

可以很明显的看到公式中出现了2个i的变量，昨天晚上脑子晕了，今天才发现，正确的公式应该如下图所示：

发散的误差函数

我的误差函数是均方根值：

我在程序里面的实现如下图所示：

det_Ek_v[i] = pow((y_out - y), 2) * 0.5

然后我设置了单张图片的训练，循环跑了50次，得到的结果居然是这个东西：

写这段程序只花了一下午，一时间就没有了调试的思路，先放出我的源码，明天接着调，脑袋疼。。

首先是激励函数了，我本来打算用的是sigmoid(x)，但是收敛情况实在是太不理想了，所以我改用了ReLU，结果还是没有变化，所以我感觉可能是我程序里的逻辑有问题，在这留下调试方向。

def ReLU(x):
    # s = 1 / (1 + np.exp(-x))
    if x > 0 :
        s = x
    else:
        s = 0
    return s

def ReLUDerivative(x):
    # ds = ReLU(x) * (1 - ReLU(x))
    if x > 0 :
        ds = 1
    else:
        ds = 0
    return ds

神经网络最重要的梯度数学公式我昨天已经给出了，今天做了python的实现。

            for i in range(0, 4):
                for j in range(0, 4):
                    v[i][j] =  (y_out - y) * (y_out * (1 - y_out)) * (n[j][0] * (1 - n[j][0])) * \
                              gamma[j][0] * m[i][0]
                    w[i][0] =  (y_out - y) * (y_out * (1 - y_out)) * gamma[j][0] * \
                              (n[i][0] * (1 - n[i][0])) * v[i][i] * (m[i][0] * (1 - m[i][0])) * x_sum + w[i][0]
                    theta_2[i][0] =  -1 * (y_out - y) * (y_out * (1 - y_out)) * gamma[i][0] * \
                                    (n[i][0] * (1 - n[i][0]))
                    theta_1[i][0] =  -1 * (y_out - y) * (y_out * (1 - y_out)) * gamma[j][0] * \
                                    (n[j][0] * (1 - n[j][0])) * v[i][j] * (m[i][0] * (1 - m[i][0])) + theta_1[i][0]
                    gamma[i][0] =  (y_out - y) * (y_out * (1 - y_out)) * n[i][0]
                    theta_3 = -1 *  (y_out - y) * (y_out * (1 - y_out))

            for i in range(0, 4):
                for j in range(0, 4):
                    v[i][j] = v[i][j] - study_step * v[i][j]
                    w[i][0] = w[i][0] - study_step * w[i][0]
                    theta_2[i][0] = w[i][0] - study_step * theta_2[i][0]
                    theta_1[i][0] = theta_1[i][0] - study_step * theta_1[i][0]
                    gamma[i][0] = gamma[i][0] - study_step * gamma[i][0]
                    theta_3 = theta_3 - study_step * theta_3

今天在做梯度公式实现的时候发现了一个问题，那就是虽然我只有一个单一的神经元，但是我在这个神经元里面输入了一个有784个数据的一维数组，导致我在处理隐层和输出层神经元的时候每个神经元都要对输入的数据做循环操作。而且我的最终输出神经网络输出也是一个一维的向量，因此我就把这个向量和输入向量做了一个对应位相减，然后把差值做累加求平均的做法，仔细一想这个方法是有问题的，因为这样做的话和我直接把输入的一维数组求均值输入是没有区别的，因此这个问题很有可能也是导致我的误差函数发散的原因。

下面这一段程序是我更新梯度的实现：

            for i in range(0,4):#[1,4]
                for j in range(0,784):
                    m[i][j] = x[j] * w[i][0] - theta_1[i];
                    m[i][j] = ReLU(m[i][j])

            # print(m)

            for i in range(0,4):#[1,4]
                for j in range(0,784):
                    n[i][j] = m[0][j] * v[0][i] + m[1][j] * v[1][i] + m[2][j] * v[2][i] + \
                              m[3][j] * v[3][i] - theta_1[i];
                    n[i][j] = ReLU(n[i][j])
            # print(n)

            for i in range(0, 784):
                y_arr[0][i] = n[0][i] * gamma[0][0] + n[1][i] * gamma[1][0] + n[2][i] * gamma[2][0] +\
                        n[3][i] * gamma[3][0] - theta_3;
                y_arr[0][i] = ReLU(y_arr[0][i])

明天回来继续调，冲了！

BP神经网络

原创文章作者：worker。如若转载，请注明出处：古月居 http://admin.guyuehome.com/34682

打赏 0

上一篇：[BPnet识别MNIST05]神经网络梯度下降公式分析

下一篇：[BPnet识别MNIST07]神经网络的实现以及调优

[BPnet识别MNIST06]发散的误差函数

worker

写在前面

公式纠正

发散的误差函数

为你推荐

强化学习基础 Ⅸ: 一文读懂 TRPO 原理与实现

yolov3（三：算法框架解析）

[基于Pytorch的MNIST识别05]总结

windows10+vs2017+opencv3.4.1配置YOLOV4

（五）近端策略优化

精选CV学习笔记-Faster-RCNN

评论（0）

关于作者

worker

105

0

1

6

Python+MQTT+MySQL实现获取边缘设备上行数据

决策树的剪枝处理之后剪枝

[c++05]const和const_cast

相关推荐

一款国产目标检测标注软件CasiaLabeler

[MNIST06]pytorch

【目标检测】keras-yolo3-tiny训练自己的数据集（目标：人&车辆）

卷积神经网络（VGG-11）识别Fashion-MNIST数据集（Pytorch版）

目标检测|YOLO原理与实现

RNN & Seq2Seq

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

TA的专栏

gazebo

c++

ros

传统路径规划方法

LeetCode

机器学习

多谢老板！

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板