需要理解的一些数理统计方法

地理加权回归方法（Geographically Weighted Regression, GWR）

https://blog.csdn.net/sinat_36744986/article/details/87864244

空间统计有别于经典统计学的两大特征：空间相关性和空间异质性，莫兰指数等可以用来量化空间相关性，那么地理加权回归，就可以用来量化空间异质性。

1）地理加权回归的定义

地理加权和其他回归分析一样，首先要划定一个研究区域，当然，通常这个区域也可以包含整个研究数据的全体区域（以此扩展，你可以利用空间关系（比如k-临近），进行局部地理加权计算）……接下去最重要的就是利用每个要素的不同空间位置，去计算衰减函数，这个是一个连续的函数，有了这个衰减函数，当你把每个要素的空间位置（一般是坐标信息（x,y))和要素的值带入到这个函数里面之后，就可以得到一个权重值，这个值就可以带入到回归方程里面去。

2）空间权重矩阵的确定

地理加权回归里最重要的就是空间权重矩阵。

空间权重矩阵用是空间关系概念化计算出来的：

无论是临近方法，还是触点方法，都会导致局部回归的结果，也就是计算的区间不一样，会导致样本数量的变化，而全部加进来运算，又变成全局回归了，所以在GWR中，能且能够选择的，只有距离方法了。

GWR中最常用的权函数（就是选择一个连续单调的递减函数来表示权重w和距离d之间关系，以此来克服反距离的缺点。）

Gauss函数法

近高斯函数
但是，如果数据非常离散，带来的结果就是有大量的数据躲得远远的，这种所谓的“长尾效应”会带来大量的计算开销，所以在实际运算中，应用的是近高斯函数来替代高斯计算，把那些没有影响（或者影响很少）的点给截掉，以提高效率。

bi-square函数其实是距离阈值法和Gauss函数发法的结合。回归点在带宽的范围内，通过高斯联系单调递减函数计算数据点的权重，超出的部分，权重全部记为0。

地理加权回归对权函数的选择不是很敏感，但是对于带宽的变化却非常敏感。带宽过大会导致回归参数的偏差过大，带宽过小又会导致回归参数的方差过大。

确定带宽

CV（交叉验证）

AIC（最小信息准则）

关于高斯函数

https://blog.csdn.net/qinglongzhan/article/details/82348153

posted @ 2020-07-12 22:29 ShaneGao 阅读(892) 评论(0) 收藏举报

刷新页面返回顶部

ShaneGao

需要理解的一些数理统计方法

1）地理加权回归的定义

2）空间权重矩阵的确定

公告