第二部分:更一般的神经网络-神经网络的矩阵方式
- 网络共有l层
- z(k),a(k),b(k)为向量,用zi(k),ai(k),bi(k)表示其第i个分量
- 输出可以是向量,用yi表示第i个分量。
设对于一个输入向量x,其标签为y,就有:
先推到E对“枢纽变量”的偏导数->推到对所有ω和b的偏导。
设置枢纽变量为:
最后1层(l层)有:
那么如何通过m+1层推导第m层呢?
有
我们在前面知道:
容易求出:
总结一般情况下的后向传播算法流程
(1)对神经网络每一层的各个神经元,随机选取相应的ω,b的值
(2)前向计算,对于输入的训练数据计算并保留每一层的输出值,直到计算出最后一层的输出y
(3)设置目标函数E,如
用后向传播算法对每一个ω和b计算
(4)利用如下迭代公式,更新ω和b的值:
(5)回到2.不断循环,直到所有
很小为止,退出循环。
微信扫描下方的二维码阅读本文
