计算图

1、计算图应该是一个重要概念,在书上和stanford的课程上都有重要介绍;计算图的输入是没有加入节点的,所有的边代表着数值的传输,所有的节点代表着一个运算;

2、关于矩阵梯度的问题。这里Wx=q  dq/dW=xT;就在先这么写一次记一次吧;

3、关于python 中的from import 问题不止忘记了一遍了在这里记下一个记忆:

所谓的from 包 import 工具;有时候,包的名字和工具的名字可能是一样的而已;

4、在卷积移动的时候,步长,有时候doesnt work;比如7×7的原图,3×3的fiiter,stride不能选择3;

5、(N-F)/stride +1 = activation size

疑问

1、batch normalization的内容需要重新看一遍,在lecture6 训练1的课程里;这里只懂了一个大概;主要是那个操作的过程,是什么意思;//我看懂了,好吧。。。不过,为什么会坍塌,应该是因为,tanh的原因;//这个就不存在疑问了;

2、就是在这一节课,最后的超参数的选择上,好像有的不太懂的地方,是叫什么。。。emmm,回看了一下似乎也动了,babysitting可能还有的问题,不过我感觉问题可能不是很大了吧,那个章节好像是针对所有due内容的一个小的总结,至于为什么最后一个是超参数,可能是因为最后一个是在最外层需要考虑的东西,是从时间轴上考虑的吧。

3、

posted @ 2018-08-20 22:46  loooffeeeey  阅读(76)  评论(0)    收藏  举报