吴恩达深度学习 —— 4.5 搭建深层神经网络块

2023-03-17 21:31:25

如下图，这是一个层数较少的神经网络，我们选择其中一层，从第二层隐藏层的计算着手，在第l层有参数 W l [ ] W^{l[]} Wl[]和 b [ l ] b^{[l]} b[l]，正向传播里有输入的激活函数，输入的前一层是 a [ l − 1 ] a^{[l-1]} a[l−1]，输出是 a [ l ] a^{[l]} a[l]。 z [ l ] = W [ l ] a [ l − 1 ] + b z^{[l]}=W^{[l]}a^{[l-1]}+b z[l]=W[l]a[l−1]+b， a [ l ] = g [ l ] ( z [ l ] ) a^{[l]}=g^{[l]}(z^{[l]}) a[l]=g[l](z[l])，这就是如何从输入 a [ l − 1 ] a^{[l-1]} a[l−1]到输出的。

之后就可以把 z [ l ] z^{[l]} z[l]的值缓存起来，因为缓存的 z [ l ] z^{[l]} z[l]对以后的正向和反向传播的步骤非常有用。

在反向传播步骤，同样也是第 l l l层的计算，你会需要实现一个函数，输入为 d a [ l ] da^{[l]} da[l]，输出为 d a [ l − 1 ] da^{[l-1]} da[l−1]。一个小细节需要注意，输入在这里其实是 d a [ l ] da^{[l]} da[l]和缓存的 z [ l ] z^{[l]} z[l]值。输出除了 d a [ l − 1 ] da^{[l-1]} da[l−1]外，还有 d w [ l ] dw^{[l]} dw[l]和 d b [ l ] db^{[l]} db[l]。

总结起来就是，在第 l l l层会有正向函数，输入 a [ l − 1 ] a^{[l-1]} a[l−1]并且输出 a [ l ] a^{[l]} a[l]。为了计算结果，还需要参数 W [ l ] W^{[l]} W[l]和 b [ l ] b^{[l]} b[l]，以及输出到缓存的 z [ l ] z^{[l]} z[l]。

然后用作反向传播的反向函数是另外一个函数，输入 d a [ l ] da^{[l]} da[l]输出 d a [ l − 1 ] da^{[l-1]} da[l−1]，这会得到对激活函数的导数，计算过程需要 W [ l ] W^{[l]} W[l]和 b [ l ] b^{[l]} b[l]和 d z [ l ] dz^{[l]} dz[l]，可以计算输出 d W [ l ] dW^{[l]} dW[l]和 d b [ l ] db^{[l]} db[l]。

吴恩达深度学习 —— 4.5 搭建深层神经网络块

继续阅读

吴恩达深度学习（笔记+作业）·第四课·第一周卷积神经网络一、计算机视觉二、边缘检测三、padding、stride四、三维卷积（加入其他通道）五、卷积网络六、卷积神经网络作业

吴恩达深度学习 —— 2.8 计算图的导数计算

吴恩达深度学习-第一课第三周编程作业

吴恩达深度学习 deeplearning.ai (4-4) 编程作业第二部分 - 神经风格转换深度学习在艺术上的应用：神经风格转换

吴恩达深度学习 4-1 课后作业 Convolutional Neural Networks: ApplicationConvolutional Neural Networks: Application¶

吴恩达第四课第三周编程作业目的连接代码

吴恩达深度学习 —— 3.6 激活函数

吴恩达第一课第四周编程作业

assignment2_1_Vector

吴恩达深度学习第一课第二周第二周神经网络基础

变分自编码器VAE实现MNIST数据集生成by Pytorch

吴恩达深度学习笔记02——改善深层神经网络1深度学习的实用层面

吴恩达深度学习 | 神经网络和深度学习（第二周神经网络基础）

【吴恩达深度学习】【神经网络和深度学习】第三章第三节计算神经网络的输出