随笔档案「2024年1月3日」：Mirror Descent ... - 行而上

2024年1月3日

摘要：我们已经知道梯度下降的每一次迭代可以看作求\(\hat f(x)=f(x_k)+\lang \nabla f(x_k),x-x_k\rang+\dfrac{1}{2\eta}\|x-x_k\|^2\)的最小值，而\(\hat f(x)\)的选取其实并不是唯一的，换言之我们不一定要选取二次函数。二次函阅读全文

posted @ 2024-01-03 14:19 行而上阅读(474) 评论(1) 推荐(0)

行而上

To The Things Themselves