27：RNN循环神经网络-RNN layer

1:RNN layer的计算

【注】这里W的shape为[hidden len,feature len],hidden len意思是每句话的当前单词需要用多少个不同的W向量进行提取特征（结果将feature len压缩成hidden len实现降维）。feature len的意思是由于每个单词由feture len个特征表示，故每个不同的W的维度也必须是feature len。

[注]x:[seq len,batch, feature len]。seq len为时间序列也即是每句话的单词数量。

x_t=[batch,feature len]x_t表示t时刻输入的每句话的每个单词用多少个（feature len）特征表示。

h:[seq len,batch,hidden len].hidden len表示每句话的记忆单元（每个单词降维后的叠加）需要用多少个不同的W向量进行特征提取（结果将feature len压缩成hidden len实现降维）。

h_t=[batch ,hidden len]h_t表示t时刻数的每句话的记忆单元（每个单词降维后的叠加）用多少个（hidden len）不同的W向量进行特征提取（结果将feature len压缩成hidden len实现降维）。

Whh=[hidden len,hidden len]