需要理解的一些数理统计方法
地理加权回归方法(Geographically Weighted Regression, GWR)
https://blog.csdn.net/sinat_36744986/article/details/87864244
空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,那么地理加权回归,就可以用来量化空间异质性。
1)地理加权回归的定义
地理加权和其他回归分析一样,首先要划定一个研究区域,当然,通常这个区域也可以包含整个研究数据的全体区域(以此扩展,你可以利用空间关系(比如k-临近),进行局部地理加权计算)……接下去最重要的就是利用每个要素的不同空间位置,去计算衰减函数,这个是一个连续的函数,有了这个衰减函数,当你把每个要素的空间位置(一般是坐标信息(x,y))和要素的值带入到这个函数里面之后,就可以得到一个权重值,这个值就可以带入到回归方程里面去。
2)空间权重矩阵的确定
地理加权回归里最重要的就是空间权重矩阵。
空间权重矩阵用是空间关系概念化计算出来的:

无论是临近方法,还是触点方法,都会导致局部回归的结果,也就是计算的区间不一样,会导致样本数量的变化,而全部加进来运算,又变成全局回归了,所以在GWR中,能且能够选择的,只有距离方法了。
GWR中最常用的权函数(就是选择一个连续单调的递减函数来表示权重w和距离d之间关系,以此来克服反距离的缺点。)
Gauss函数法
近高斯函数
但是,如果数据非常离散,带来的结果就是有大量的数据躲得远远的,这种所谓的“长尾效应”会带来大量的计算开销,所以在实际运算中,应用的是近高斯函数来替代高斯计算,把那些没有影响(或者影响很少)的点给截掉,以提高效率。
bi-square函数其实是距离阈值法和Gauss函数发法的结合。回归点在带宽的范围内,通过高斯联系单调递减函数计算数据点的权重,超出的部分,权重全部记为0。
地理加权回归对权函数的选择不是很敏感,但是对于带宽的变化却非常敏感。带宽过大会导致回归参数的偏差过大,带宽过小又会导致回归参数的方差过大。
确定带宽
CV(交叉验证)
AIC(最小信息准则)
关于高斯函数

浙公网安备 33010602011771号