
LSTM的各类门结构
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文探讨长短期记忆网络(LSTM)中各种门结构的设计与功能,深入解析它们在序列数据建模中的作用机制。
在实现LSTM代码的过程中,由于忘记了各种门的原理而感到有些困难。这里重新巩固一下相关知识:普通的RNN无法很好地处理距离当前位置较远的信息依赖问题,而LSTM通过改变每个隐藏层内部结构来解决这个问题,并能够更好地控制“记忆”。具体来说,这种特殊的结构主要思想是将信息存储在多个记忆细胞中,不同隐藏层的记忆细胞之间通过少量的线性交互形成一个传递带(图中的红线),从而实现信息流动。此外,LSTM还引入了一种叫做“门”的机制来增加或删除记忆单元内的信息,并控制这些信息的流向。这种结构包括三个输入:当前位置特征x、前一隐藏层的状态a以及前一时间步的记忆细胞c;同时产生三个输出:当前隐藏层状态a、当前记忆细胞c和当前位置预测值。
全部评论 (0)
还没有任何评论哟~


