BPTT算法推导
摘要:随时间反向传播 (BackPropagation Through Time,BPTT) 符号注解: $K$:词汇表的大小 $T$:句子的长度 $H$:隐藏层单元数 $E_t$:第t个时刻(第t个word)的损失函数,定义为交叉熵误差$E_t= y_t^Tlog(\hat{y}_t)$ $E$:一个句
阅读全文
posted @ 2016-03-31 16:35
大部分笔记已经转移到 https://github.com/hschen0712/machine_learning_notes ,QQ:357033150, 欢迎交流
posted @ 2016-03-31 16:35
posted @ 2015-10-24 19:51