随笔档案「2019年6月17日」：regularization ... - _zwl

2019年6月17日

摘要：通过让各$\theta_i(i 0)$值尽量小一些，可以避免overfitting (why?) 在$J(\theta)$上增加$\frac{\lambda}{2m} \sum_{i=1}^n \theta_i^2$ (注意$\theta_0$不需要加) 注意这里分母$2m$不是$2n$ (why 阅读全文

posted @ 2019-06-17 20:56 _zwl 阅读(191) 评论(0) 推荐(0)

neural network

摘要： some example 当x为binary时 structure 以四层的multi class classification为例（以01向量列表示分类预测。第i个最接近1则预测为第i个） $\theta^{(l)}_{ji}$表示第$l$层第$i$个神经元到下一层第$j$个神经元的转移的系数记阅读全文

posted @ 2019-06-17 17:23 _zwl 阅读(383) 评论(0) 推荐(0)

acha

Again