加载中...

摘要: 对损失求平均是为了让梯度值不至于过大 batchsize小挺好的 过大就难收敛了 理论上不会导致影响结果 网络参数更新的梯度 是所有样本的梯度求和取平均值 随机梯度是采样随机 不是批量大小随机 牛顿法快 但不一定收敛结果好 训练集 验证集 测试集(只用一次) 超参数是自己设置的 而不是训练的 权重衰 阅读全文
posted @ 2022-08-23 21:57 liang302 阅读(66) 评论(0) 推荐(0)
摘要: 如 华为挑战赛2022第1题 阅读全文
posted @ 2022-08-23 02:48 liang302 阅读(28) 评论(0) 推荐(0)
摘要: ##模板 void insert() //建trie树 { int p = 0; for (int i = 0; str[i]; i ++ ) { int t = str[i] - 'a'; if (!tr[p][t]) tr[p][t] = ++ idx; p = tr[p][t]; } cnt[ 阅读全文
posted @ 2022-08-23 02:47 liang302 阅读(25) 评论(0) 推荐(0)