LSTM
LSTM(Long Short-Term Memory)是一种特殊的循环神经网络(RNN),它通过引入门控机制来缓解梯度消失和梯度爆炸问题,从而能够更好地处理长序列数据。
# LSTM 的结构
LSTM 的基本结构包括三个门:输入门(input gate)、遗忘门(forget gate)和输出门(output gate),以及一个记忆单元(cell state)。这些门和单元共同作用,使得 LSTM 能够记住长序列中的信息。
LSTM 的输入包括当前时间步的输入数据 xtx_txt 和前一时间步的隐藏状态 ht−1h_{t-1}ht−1。输入门控制着当前时间步的输入数据如何更新记忆单
more...