02 2021 档案
摘要:梯度下降 https://zhuanlan.zhihu.com/p/32626442 SGD 原始的梯度下降算法:对参数减去当前参数的负梯度 动量算法 梯度=上一次的梯度 和 当前梯度的加权和 优点:减少收敛过程中的震荡,使得收敛过程更加平滑,能加速收敛过程。 Nesterov 比Momentum更
阅读全文
摘要:A、A - B = C 题目:给定L、R,求问存在多少个A、B、C三元组,使得A=B+C,其中L <= A <= R, L <= B <= R, L <= C <= R 答案:针对一个固定的A,存在满足条件的(B、C)两元组的数量为 A - 2 * L + 1,所以当你遍历A时,答案为一个等差数列,
阅读全文

浙公网安备 33010602011771号