Typesetting math: 100%

黑塞矩阵(Hessian Matrix)

黑塞矩阵和雅可比矩阵,相信搞机器学习方向的同学多多少少也听过一点。但是平时毕竟用到的还是不多,因此也不是很重视,甚至对它们的定义也不是很清楚。😫😫😫此次,就借这个博客梳理一下黑塞矩阵及其用途。🐳

定义

黑塞矩阵是由多元函数的二阶偏导组成的矩阵。假设 f(x1,x2,...,xn) 二阶可导,则其黑塞矩阵为:

[2fx122fx1x2...2fx1xn2fx222fx22...2fx2xn............2fxnx12fxnx2...2fxn2]

一般情况下,多元函数的混合二阶偏导与求导次序无关,即:

2fxixj=2fxjxi

函数凹凸性与黑塞矩阵

先说一下凹凸函数:

凹函数
对于函数 f(x) ,对于其定义域内的任意两点 x, y ,以及任意实数 θ[0,1] ,若

f(θx+(1θ)y)θf(x)+(1θ)f(y)

成立,则 f 为凸函数(下凸)。若上式严格成立(将小于等于换成小于),则为严格凸函数。同理可定义凹函数(上凸)和严格凹函数。

假设 f(x1,x2,...,xn) 二阶可导,则

  • 若其黑塞矩阵半正定,则函数是凸函数
  • 若黑塞矩阵正定,则函数为严格凸函数
  • 若黑塞矩阵半负定,则函数为凹函数
  • 若黑塞矩阵负定,则函数为严格凹函数

函数极值与黑塞矩阵

x0f(x) 的驻点(梯度为0的点),则:

  • 黑塞矩阵在该点处正定,则 f 在该点有严格极小值
  • 黑塞矩阵在该点处负定,则 f 在该点有严格极大值
  • 黑塞矩阵在该点处不定,则该点不是极值点,为鞍点

多元函数求极值的过程:求梯度,找到所有驻点 ==> 计算在驻点处的黑塞矩阵 ==> 判断驻点是否为极值点。

posted @ 2021-11-30 11:06  Milkha  阅读(5187)  评论(0)    收藏  举报
编辑推荐:
· 大数据高并发核心场景实战,数据持久化之冷热分离
· 运维排查 | SaltStack 远程命令执行中文乱码问题
· Java线程池详解:高效并发编程的核心利器
· 从“看懂世界”到“改造世界”:AI发展的四个阶段你了解了吗?
· 协程本质是函数加状态机——零基础深入浅出 C++20 协程
阅读排行:
· .NET 8 gRPC 实现高效100G大文件断点续传工具
· STM32学会要花费多长时间?一个从机械转行老程序员的血泪史
· LinqPad:C#代码测试学习一品神器
· .NET入行第4年(第二集)
· C#/.NET/.NET Core技术前沿周刊 | 第 43 期(2025年6.16-6.22)
点击右上角即可分享
微信分享提示