目录
-
-
- LSTM神经网络
- LSTM原理
- LSTM数据下载
- LSTM程序设计
-
- 导入Python包
- 时序数据处理
- LSTM模块定义
- 模型训练
- 模型评估
- 参数设定
- 运行结果
- 参考资料
- 致谢
-
LSTM神经网络
长短期记忆网络——通常简称为“LSTM”——是一种特殊的 RNN,能够学习长期依赖关系。它们由Hochreiter & Schmidhuber (1997)引入,并在后续工作中被许多人提炼和推广。1它们在处理各种各样的问题时效果非常好,现在被广泛使用。LSTM 被明确设计为避免长期依赖问题。长时间记住信息实际上是他们的默认行为,而不是他们努力学习的东西!所有循环神经网络都具有神经网络重复模块链的形式。在标准 RNN 中,这个重复模块将具有非常简单的结构,例如单个 tanh 层。