当前位置：首页 > Web开发 > 正文

而后向传播算法可以帮助我们计算偏导数：对于每个训练样本

2024-03-31 Web开发

标签：

一、Cost Function and Backpropagation

神经网络的损掉函数：
\[J(\Theta) = - \frac{1}{m} \sum_{i=1}^m \sum_{k=1}^K \left[y^{(i)}_k \log ((h_\Theta (x^{(i)}))_k) + (1 - y^{(i)}_k)\log (1 - (h_\Theta(x^{(i)}))_k)\right] + \frac{\lambda}{2m}\sum_{l=1}^{L-1} \sum_{i=1}^{s_l} \sum_{j=1}^{s_{l+1}} ( \Theta_{j,i}^{(l)})^2\]

这个cost function是在logistic regression根本上演变而来，只是神经网络有很多输出结点，而logistic regression只有一个输出结点，所以这个cost function只是把所有的K个输出结点的损掉函数进行累加。

得到cost function后，为了寻找使得\(J(\theta)\)最小的那组参数\(\theta\)，我们需要知道\(J(\theta)\)关于每个\(\theta\)的偏导数，而后向流传算法可以辅佐我们计算偏导数：

技术图片

对付每个训练样本，先操作forward propagation计算每一层的\(a\)：

技术图片

接着操作样本真实标签\(y^{(t)}\)计算最后一层的误差值；

之后从右向左计算每一层（输入层除外）的误差：

这样每个样本一次正向、一次反向来更新误差矩阵：

向量化暗示：

最后，就可以得到偏导数：

二、Backpropagation in Pratice

为了使用fminunc等高级的优化要领来求得cost function的最小值，所以将\(\theta\)这个矩阵展成向量传入fminunc，完成后可以通过reshape从向量中提取\(\theta^{(1)}、\theta^{(2)}\)等：

技术图片

为了确保我们使用Backpropagation求得的偏导数的正确性，可以使用Gradient Checking（很慢）来查验：
按照偏导数界说：
\[\dfrac{\partial}{\partial\Theta_j}J(\Theta) \approx \dfrac{J(\Theta_1, \dots, \Theta_j + \epsilon, \dots, \Theta_n) - J(\Theta_1, \dots, \Theta_j - \epsilon, \dots, \Theta_n)}{2\epsilon}\]
\[一般\epsilon=10^{-4}\]
通过将这种方法计算的偏导数与之前Backpropagation求得的偏导数对照，即可得知Backpropagation的正确性。

之前在Linear Regression和Logistic Regression，我们可以用全0来初始化\(\theta\)，，但在神经网络中，这样做会有问题，所以给与随机初始化：

技术图片

最后，从整体捋一遍流程：
1、选择网络布局：

技术图片

2、训练神经网络：

对每一个训练样本：

技术图片

温馨提示: 本文由Jm博客推荐，转载请保留链接: https://www.jmwww.net/file/web/32453.html

而后向传播算法可以帮助我们计算偏导数：对于每个训练样本

推荐文章

热门文章

标签

友情链接

关于本站

联系我们

特别鸣谢

而后向传播算法可以帮助我们计算偏导数： 对于每个训练样本

推荐文章

热门文章

标签

友情链接

关于本站

联系我们

特别鸣谢

而后向传播算法可以帮助我们计算偏导数：对于每个训练样本