RNNs on loveLZZ的个人博客

QRNN

Sat, 19 Feb 2022 10:09:43 +0800

将RNN与CNN结合
- 卷积层用一种不使用未来数据的masked卷积来代替LSTM中参数矩阵与上一时刻隐藏层相乘的操作。捕获过去时刻信息的同时简化了LSTM中的的操作，因为在计算过程中删除了隐藏层，仅仅使用输入数据来捕获依赖
- 池化层使用各种门结构，例如LSTM的门结构和GRU的门结构使得梯度流稳定
通过上述操作简化了LSTM的计算，使其可以并行

标准的RNN包括门变种LSTM等因为无法并行计算，因此在长序列的任务中性能受到了限制。
将CNN用于序列模型时
- 并行性更好
- 可以更好地扩展到长序列
- 但因为最大和平均池化时假设了时间不变性，（在一次卷积池化过程中，时间步的顺序会被忽略，移动卷积核的过程中，进行相同的池化操作，不同时间步的重要性不同同样也会被忽略）因此无法充分利用大规模序列的顺序信息。
因此作者提出了一种将CNN和RNN混合的模型QRNN，既能跨时间步和小批量维度进行并行计算，又使得输出取决于总体顺序。性能更优秀且更节省时间

Thu, 17 Feb 2022 15:42:05 +0800

\begin{align*} s_t &= (1-\alpha)Bx_t + \alpha s_{t-1} \\ h_t &= \sigma(Ps_t+Ax_t+Rh_{t-1}) \\ y_t &= f(Uh_t+Vs_t) \end{align*}

Thu, 23 Dec 2021 10:27:32 +0800

虽然效果上有改进，但并不常用，原因可能如下