> 文章列表 > Python深度学习026:基于Pytorch的典型循环神经网络模型RNN、LSTM、GRU的公式及简洁案例实现(官方)

Python深度学习026:基于Pytorch的典型循环神经网络模型RNN、LSTM、GRU的公式及简洁案例实现(官方)

Python深度学习026:基于Pytorch的典型循环神经网络模型RNN、LSTM、GRU的公式及简洁案例实现(官方)

文章目录

  • 1. 简介
  • 2. 参数的理解
    • 2.1. 层数的概念
    • 2.2. 官方案例中的三个参数的解释
  • 3. 官方公式及案例
    • 3.1. RNN
    • 3.2. LSTM
    • 3.3. GRU

1. 简介

循环神经网络(也有翻译为递归神经网络)最典型的三种网络结构是:

  • RNN(Recurrent Neural Network,循环神经网络)
  • LSTM(Long Short-Term Memory,长短期记忆网络)
  • GRU(Gate Recurrent Unit,门控循环单元)

2. 参数的理解

2.1. 层数的概念

理解参数的含义非常重要,否则,你不知道准备什么维度的输入数据送入模型

先看一下 两层双向lstm的网络结构,两层(双层)、双向的概念:

  • 两层:跟深层堆叠神经网络里面的层的概念是类似的,如图绿色是第一层&#x