摘要: 1.Tuning Process 对超参数的一个调试处理 一般而言,在调试超参数的过程中,我们通常将学习率learning_rate看作是最重要的一个超参数,其次是动量梯度下降因子β(一般为0.9),隐藏层单元个数,mini-batch size,再然后是layers,learning rate d 阅读全文
posted @ 2018-08-02 20:38 Dar_Alpha 阅读(879) 评论(2) 推荐(1)
摘要: 1. 第 1 个问题 If searching among a large number of hyperparameters, you should try values in a grid rather than random values, so that you can carry out 阅读全文
posted @ 2018-08-02 11:02 Dar_Alpha 阅读(1079) 评论(0) 推荐(0)