动态RNN和静态RNN的区别

RNN的结构

　　首先，我们先来看一下RNN神经网络的结构图，左边是未展开前的，右边是展开后的。

　　当你代码调用static_rnn实际上是生成了rnn按时间序列展开之后的图。打开tensorboard你会看到sequence_length个rnn_cell stack在一起，只不过这些cell是share weight的。因此，sequence_length就和图的拓扑结构绑定在了一起，因此也就限制了每个batch的sequence_length必须是一致。

　　调用dynamic_rnn不会将rnn展开，而是利用tf.while_loop这个api，通过Enter, Switch, Merge, LoopCondition, NextIteration等这些control flow的节点，生成一个可以执行循环的图（这个图还是静态图，因为图的拓扑结构在执行时是不会变化的）。在tensorboard上，你只会看到一个rnn_cell, 外面被一群control flow节点包围着。对于dynamic_rnn来说，sequence_length仅仅代表着循环的次数，而和图本身的拓扑没有关系，所以每个batch可以有不同sequence_length。

posted @ 2020-02-10 19:48 淇则有岸阅读(727) 评论(0) 收藏举报

刷新页面返回顶部

淇则有岸，隰则有泮

动态RNN和静态RNN的区别

公告