天天看点

LSTM神经网络

LSTM即Long Short Memory Network,长短时记忆网络。它其实是属于RNN的一种变种,可以说它是为了克服RNN无法很好处理远距离依赖而提出的。

我们说RNN不能处理距离较远的序列是因为训练时很有可能会出现梯度消失,即通过下面的公式训练时很可能会发生指数缩小,让RNN失去了对较远时刻的感知能力。

LSTM神经网络
LSTM神经网络

回顾一下RNN的模型,如下图,展开后多个时刻隐层互相连接,而所有循环神经网络都有一个重复的网络模块,RNN的重复网络模块很简单,如下下图,比如只有一个tanh层。 

LSTM神经网络
LSTM神经网络

而LSTM的重复网络模块的结构则复杂很多,它实现了三个门计算,即遗忘门、输入门和输出门。每个门负责是事情不一样,遗忘门负责决定保留多少上一时刻的单元状态到当前时刻的单元状态;输入门负责决定保留多少当前时刻的输入到当前时刻的单元状态;输出门负责决定当前时刻的单元状态有多少输出。

LSTM神经网络

每个LSTM包含了三个输入,即上时刻的单元状态、上时刻LSTM的输出和当前时刻输入。

LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络
LSTM神经网络

相关阅读: 

<a href="http://blog.csdn.net/wangyangzhizhou/article/details/74348279">神经网络的交叉熵损失函数</a>

========广告时间========

<a href="http://blog.csdn.net/wangyangzhizhou/article/details/74080321">为什么写《Tomcat内核设计剖析》</a>

=========================

欢迎关注:

LSTM神经网络

继续阅读