02 2021 档案

摘要:梯度下降 https://zhuanlan.zhihu.com/p/32626442 SGD 原始的梯度下降算法:对参数减去当前参数的负梯度 动量算法 梯度=上一次的梯度 和 当前梯度的加权和 优点:减少收敛过程中的震荡,使得收敛过程更加平滑,能加速收敛过程。 Nesterov 比Momentum更 阅读全文
posted @ 2021-02-17 18:06 wa007 阅读(121) 评论(0) 推荐(0)
摘要:A、A - B = C 题目:给定L、R,求问存在多少个A、B、C三元组,使得A=B+C,其中L <= A <= R, L <= B <= R, L <= C <= R 答案:针对一个固定的A,存在满足条件的(B、C)两元组的数量为 A - 2 * L + 1,所以当你遍历A时,答案为一个等差数列, 阅读全文
posted @ 2021-02-13 23:01 wa007 阅读(281) 评论(0) 推荐(0)