如何用ArcGIS做出地理断点回归中的距离变量

2021-08-18 11:12:51 浏览数 (1)

最近再学习断点回归,其中深深被地理断点回归所折服,其设计思路之巧妙真的让人拍案叫绝。

Dell开创性地将地理边界断点问题引入了断点回归设计研究问题领域, 也就是在其实证研究中分组变量为地理距离, 断点为地理边界, 他研究了16至19世纪西班牙殖民政府在秘鲁某些地区实行的米塔 (Mita) 劳役制度对经济发展的影响, 实证结果发现米塔劳役制度使得当今这些地区家庭消费水平降低25%, 并使得儿童身高矮小率增加了6%。Chen等学者同样利用地理断点回归设计的方法研究了中国北方地区冬季集中供暖制度对当地居民平均预期寿命的影响, 以秦岭和淮河为界中国的冬季集中供暖机制只覆盖北部地区, 这为建立地理断点回归设计研究提供了很好的现实基础, 这份研究发现空气中总悬浮颗粒物 (TSP) 每上升100μg/m, 居民平均预期寿命大约减少3年, 而这种集中供暖政策使得北方的空气中TSP比南方平均水平高184μg/m, 这意味着该政策使得北方5亿居民相对南方平均预期寿命大约降低5.5年, 总预期寿命减少超过25亿年。

再如JPE上的《Willingness to Pay for Clean Air: Evidence from Air Purifier Markets in China》这篇文章中使用了80个城市作为研究对象,也是将淮河/秦岭线作为地理边界,并根据城市和河流的位置制作了距离变量,使用ArcGIS来测量从城市质心到河边最近点的最短距离。

假如我们以后也要去写一篇地理断点回归论文的话,可能也会碰到选取样本地区到地理边界的最短距离并以此作为断点回归的关键变量。那么一个关键问题怎么提取这种距离。通常来说,我们需要两类图层(通常为点要素与线要素)再结合arcgis里的几个工具就可以很好的完成这类操作。其中点要素就是我们研究对象区域或个体,如果是城市、县域的话可以将其生成质心坐标来转为点要素,而地理边界则为线要素,有了这两类要素后我们再结合以下三大工具就可以完成目标。

【生成临近表】工具----生成每条道路和每个点的距离;

【汇总统计数据】工具---筛选出每个点到每条道路的一组距离中最小的距离;

【连接】工具---将点和筛选出的结果进行连接。

接下来,我们以一个案例操作,以江西各城市到高速公路的距离为例来进行操作说明。大家可以脑补下城市为点要素,高速公路想象为我们的地理边界线要素。不要纠结符不符合地理断点回归特征,我们重点在于如何生成最短距离。

具体操作如下:

加载江西中心城市与江西高速公路的图层,并注意将数据框进行投影坐标转化,以便得到具体的单位距离。

首先登场的就是【生成临近表】工具,进入arctoolbox找到分析工具--邻域分析--生成近邻表,按照下图进行设置,如下图:

生成的结果中包含了道路ID、城市ID和城市到高速的距离

由于上述结果中包含了每个城市到每条高速公路的距离,相当于一个208*M的矩阵(208为高速公路的个数,这里高速被分成多条折线,故有208条,11为城市的个数),而研究需要的是每个城市到最近高速公路的直线距离,所以还需要对上述结果进行筛选。

接下来登场的就是【汇总统计数据】工具,该工具用来筛选出每个城市到每条高速公路的一组距离中最小的距离,进入arctoolbox找到分析工具--统计分析--汇总统计数据,然后按照下图进行参数设置:

生成的结果只包含了点到最近道路的直线距离,如下图:

终于轮到【连接】工具出场了,将城市图层和上一步生成的表进行关联,如下图:

最终就可以得到我们想要的结果,如下图:

本期操作数据连接:链接: https://pan.baidu.com/s/1Ak1zVPAb1Tqv44QCbMVoBA 提取码: tf8y 复制这段内容后打开百度网盘手机App,操作更方便哦

0 人点赞