声明:
笔记是在学习汤国安老师的ArcGIS空间分析时所记录。若有需求请联系博主。
设置参考比例
- 参考比例定义符号以所需大小显示时的比例。
- 为了使标注和标记的字体,以及符号化后的符号大小随着比例尺大小的变化而变化。
- 在设置参考比例后,大于参考比例时字体和符号方法,小于参考比例尺时字体和符号缩小。
数据框的添加:
- 主菜单——插入——数据框
按图形选择要素
- 使用“绘图”工具,绘制一个面,
- 在工具栏中选择——按图形选择
数据组织方式
- ArcGIS中主要有Shapfile、Coverage和Geodatabase 三种数据组织方式。
- Shapfile由储存空间数据的shap文件、储存属性数据的dBase表和储存空间数据与属性数据关系的 .shx 文件组成。
- Coverage的空间数据储存在二进制文件中。属性数据和拓扑数据存储在INFO中,目录合并了二进制文件和INFO表,成为Coverage要素类
- Geodatabase是面向对象的数据模型,能够表示要素的自然行为和要素之间的关系
地理数据库的基本组成项
- 关系表
- 要素类
3.要 素数据集
要素类
- 简单要素类:存放在要素数据集中,使用要素数据集的坐标,不需要重新定义空间参考。
- 独立要素类:存放在数据库中的要素数据集之外,必须定义空间参考坐标。
- 创建要素类的过程中,M值是一个线性参考值,代表一个有特殊意义的点,要素的坐标都是以M为基准标识的。
数据载入
1.必须首先在与被载入数据具有结构匹配的数据对象。
2.在ArcCatalog 目录树中,右键单击载入数据库的要素类或表,选择加载——加载数据,打开简单数据加载程序向导。
数据编辑
- 合并:同层要素空间合并,自动将选择要素的属性赋给合并后的新要素
- 联合:不同层要素空间合并,无论要素相邻还是分立,都可以合并生成一个新要素。
拓扑编辑
- 在进行拓扑编辑前,需要创建拓扑关系。使具有共享边或点的要素按照拓扑关系共享边或点。
- 创建拓扑关系后,拓扑关联要素之间就具有共享边或或点,在编辑共享边或点的过程中,拓扑关联的要素将自动更新其形状。
- 拓扑关系对空间数据的查询和分析非常重要。进行拓扑编辑时,共享边或点的移动或修改不会影响要素之间的相对空间关系,所以拓扑编辑经常用于数据更新。
- 拓扑工具,在空白处右键找到——拓扑
子类型操作
- 当需要通过默认值、属性域、连接规则、关系规则区分对象时,就需要对单一的要素类或表建立不同的子类型。
- 利用目录可以给要素添加子类型,并为每个子类型设置默认值和属性域。
关系类
- 基数(Cardinality)——描述对象之间的关系,分为:一对一(1-1)、一对多(1-M)、多对一(M-1)、多对多(M-N)
- 关联键——要创建关系,表中必须至少包含一个“共同”字段,这样的字段称为“键”。键值可以是文本型、数值型(整型)。字段不一定要一致,但是数据类型必须一致。
- 关系类的创建是在源类的主键和目标类的外键之间创建的。
- 主键:是储存能够唯一标识表中的每一个对象的字段。
- 外键:记录有源表主键信息的字段。在对象类中,外键记录值不需要唯一,而且通常也不是唯一的。
- 关联标注——在关系类中,查找关联表的时候需要关联标注,标注分为向前标注和向后标注。
- 使用向前标注可以从源类找到目标类
- 使用向后标注,可以从目标类找到源类
注释类
- 注释是用于储存描述性文本信息的专门要素类,和储存在地图文档中的标注不同,注释类储存在地理数据库中。
- 注释类分为——连接要素的注释类,不连接要素的注释类。
- 不连接要素的注释类是按照地理空间位置放置的文本,不与要素相关联
- 连接要素的注释类是与要素类的特定属性相关联,当要素被移动或删除时,与之关联的注释也会同时被移动或删除
- 创建要素时,参考比例描述了用指定的尺寸显示注记文本的比例尺,当缩小和放大地图时,文本也跟着缩放。
几何网络
- 由要素构成,这些要素被限制储存于网络中,作为网络要素。
- 逻辑网络是网络连通性的物理描述,逻辑网络中的每个元素都与几何网络中的一个要素关联。
网络要素模型
- 网络要素
- 连接网络要素
- 边必须通过连接与其他边相连
- 在逻辑网络中,边元素与网络中的边元素相关,连接要素与网络中的连接元素相关。
- 广义上,网络要素分:简单网络要素,复杂网络要素
- 简单网络要素,对应逻辑网络中的一个简单网络元素
- 复杂网络要素,对应逻辑网络中的多个网络元素
源和汇
- 网络中的物质、能量、信息的流动是有方向的
- 网络中的方向是从源到汇的
- 几何网络中的连接要素可以作为源或汇
网络权重
- 网络可以有许多权和它相关,权是根据要素的某些属性来计算的
- 网络中每个要素类都可能有部分或全部的权与其属性相关
- 每个权可以与一个要素的一个属性相关,也可以与多个要素想关。
有效和无效要素
- 在集合网络中的任何一个边要素或接合点要素在逻辑网络中可以是有效的,也可以是无效的
- 一个网络要素是否有效,是否可运行,其状态是由Enabled属性字段来维护的。
创建新的几何网络
- 需要创建在要素数据集下
- 最好在内容列表中把数据导入
定义投影
- 指按照地图信息源原有的投影方式,为数据添加投影信息。
- 使用ArcToolbox中的——数据管理工具——投影和变换——定义投影。
- 因为投影坐标系是以地理坐标系为基础的,在定义投影坐标系的时候,还需要选择或新建一个地理坐标系。
投影变化
- 是将地图地图投影转换为另一种地图投影,主要包括投影类型、投影参数或椭球体等的改变。
- 在对栅格数据实施投影转换是,要进行重采样处理
对栅格数据的投影变换
- 使用ArcToolbox中的——数据管理工具——投影和变换——栅格——投影栅格
- 需要进行投影变换的栅格数据,必须已经具有投影信息
数据变换
- 是指对数据进行诸如放大、缩小、翻转、移动、扭曲等几何位置、形状、方位的变换等操作。
- 矢量数据可以使用空间校正、编辑器等工具实现。
- 栅格数据可以使用地理配准、投影和变换工具集实现
空间校正及可执行的任务
- 用于矢量数据的空间位置匹配。
- 将数据从一个坐标系装换到另一个坐标系中
- 纠正几何变形
- 将沿着某一图层的边的要素与邻接图层的要素对齐及在图层之间复制属性
- 可以使用现有的编辑功能(如捕捉)来增强校正效果
空间校正步骤
- 启动编辑
- 设置校正数据空间校正工具条——设置校正数据
- 设置校正方法空间校正工具条——校正方法
- 仿射变化可以不同程度的缩放、倾斜、旋转和平移数据,此方法至少三个连接,对于大多数变化,推荐此方法。
- 相似变换可以缩放、旋转、平移要素,但是不会单独对轴进行缩放,也不会产生任何的倾斜,相似变换使得变换后的要素保持原有的横纵比(保持要素相对形状)。至少需要两个连接。但是要生成均方根(RMS)误差,则需要三个或三个以上连接。
- 射影变换至少需要四个位移连接,可用于对航空像片中采集的数据直接进行变换。
- 添加位移连接空间校正工具条——新建位移连接工具
- 查看连接表空间校正工具条——查看链接表,查看控制点残差和RMS。RMS小于1即可。
橡皮页变换
- 用于对两个或多个图层进行小型的几何校正,通常是使要素与更为准确的信息对齐。
注意事项
- 需要启动编辑
- 确保折点捕捉已启用
- 空间校正方法选择——橡皮页变换
边匹配
- 可用于创建两个相邻图层的位移连接
- 使用该工具前,需要设置工具属性中的参数
注意事项
- 需要启动编辑
- 确保折点捕捉已启用
重设比例尺
- 将栅格数据按照指定比例分别沿着X轴和Y轴放大或缩小。
- 数据管理工具——投影和变换——栅格——重设比例
- X比例因子——设置数据在x方向上的比例系数,值必须大于0
- Y比例因子——设置数据在y方向上的比例系数,值必须大于0
旋转
- 指将栅格数据沿着指定的中心点旋转指定角度
- 数据管理工具——投影和变换——栅格——旋转
- 枢轴点——可选项,设置旋转中心点的X,Y坐标,默认状态的旋转中心是所输入栅格数据的左下角点。
- 旋转栅格数据,需要进行重采样,是可选择项,默认状态是最邻近采样法。
数据提取
- 数据提取是从已有的数据中,根据属性表内容选择符合条件的数据,构成新的数据层
- 可以通过设置SQL表达式进行条件选择
泰森多边形
用途——定性分析、统计分析、邻近分析
网络中流动的管线(线状要素——链)
- 有形物体(街道、河流、水管、电缆线)。
- 无形物体(无线电通讯网络)
- 状态属性包括阻力和需求
点状要素
- 障碍禁止网络中链上流动的点
- 拐角点出现在网络链中所有的分割结点上状态属性的阻力,如拐弯的时间和限制(如不允许左拐)
- 中心是接受或分配资源的位置,如水库、商业中心、电站
其状态属性包括
资源容量(如总的资源量)
阻力限额(如中心与链之间的最大距离或时间限制)
网络分析工具
- 传输网络分析——网络数据集
- 效用网络分析——几何网络
传输网络分析
- 道路、地铁等交通网络分析
- 进行路径、服务范围与资源分配
- 允许在网络边上双向行驶
- 网络中的代理(司机)具有主观选择方向的能力
传输网络可解决的问题
- 计算点与点之间的最佳路径
- 时间最短或者距离最短
- 进行多点的物流派送,能够按照规定时间规划送货路径、自由调整各点的顺序
- 寻找最近的一个或者多个设施点
- 确定一个或者多个设施点的服务区
- 绘制起点——终点距离成本矩阵
- 车辆路径派发
效用网络分析
- 主要用于河流网络分析与公用设施网络分析,如水、电、气等管网
- 研究网络的状态及模拟和分析资源在网络上的流动与分配情况
- 在效用网络分析中,只允许在网络边上单向同时行进
- 网络中的代理(管道中的石油)不能选择行进的方向
- 行进的路径需要由其他外部因素来决定
效用网络分析可解决的主要问题
- 寻找连通的、不连通的管线
- 上下游追踪
- 寻找环路
- 寻找通路
- 爆管分析
网络数据集的建立
- 创建网络数据集是传输网络分析的基础。
- 传输网络分析都是基于传输网络数据集来开展的。
注意
网络数据集必须放在放在要素集下
网络分析的基本功能
- 网络分析是基于几何网络的特征和属性
- 利用距离、权重和规划条件来进行分析
网络分析——路径分析
- 最快路径确定起点、终点,求时间最短的路径
- 最短路径确定起点、终点,求距离最短的路径
- 最多场景的最短路径确定起点、终点和所要求经过的中间点、中间连线,求最短路径或最小成本路径。路径分析的内容可以通过设定阻抗实现
- N条最佳路径分析确定起点、终点,求代价代价较小的N条路径,因为实践中由于种种因素需要选择近似最佳路径
网络分析——服务区域分析
- 包括所有在设定阈值内可以到达的街道的区域,阈值可以是时间或者距离等。
- 某个点5min服务区是从该点5min之内可以到达的所有街区的区域
- 可达性(accessibility)表示从某个点到达其他地点的容易程度
- 可达性可以通过时间、距离和任意其他的阻抗进行设定
网络分析——最近设施查询
- 查询离某个位置最近的设施
- 可以设置一个停止成本,一旦超过这个设置,则不再分析
- 一旦查找到最近设施,则可以实现的功能包括到达最近设施的路径、旅行花费、方向
网络分析——源点OD成本矩阵
- 从源点到目标点的距离成本
- OD成本矩阵可以用于后勤路线分析模型,以便进行优化选择,
- 可以判断哪些商店由那个仓库提供服务会更理想,从而改进商店配送以及提供更好的物流服务
网络分析——车辆路径派发
- 针对多车辆、多订单的配送情况,为各车辆分配一组配送的订单,并确定送货的顺序,从而将总运输成本控制在最低。
- 可以考虑订单的时间窗口,可以考虑车辆对某个区域熟悉的程度
网络分析——位置分配
- 根据选址的要求为设施选择最优的位置,使得这些位置能够覆盖尽可能多的居民。
- 建设成本也可以控制在预算范围里
最优路径查找
- 点的位置可以通过三种方式设置
在屏幕上添加点,如果用户添加的点不在路径之上,则系统会根据“捕捉”设置,将该点自动咬合到近处的点
通过输入“地址”
从已经存在的要素或者要素层中导入位置
- 分析最优路径时点与点之间的顺序,可以用用户自己设置,也可以由系统自动设置
- 网络分析窗口(Network Analyst Window)显示停靠点、路径、点路障、线路障、面路障的相关信息
添加停靠点
- 停靠点按照点击的顺序标号
- 第一个停靠点被认定为出发点
- 最后一个一个停靠点被认定为是目的地
- 经停顺序可以在网络分析窗口中修改
网络分析工具栏
- 选择Network Analyst——选项,进入选项,可以用于设置加载位置的捕捉环境。
- 当一个停靠点离道路的距离大于捕捉环境的距离时,将无法定位于道路网络上,显示出一个“未定位”的符号。
- “未定位”符号可以通过“选择移动网络位置工具”将其定位到道路网络上。
设置路径分析属性
- 点击网络分析窗口中的“路径属性”按钮,其中的“分析设置”可以对“阻抗”进行设置
- 若要进行最短路径分析“阻抗”设置为距离 Meters(米)
- 若要进行最快路径路径恩分析则设置为分钟Minutes(分钟)
分析设置
- 应用时间——用来设置某个停靠点到达的时间,离开的时间
- 重新排序停靠点以查找最佳路径——用来设置由徐彤重新对停靠点进行排序来寻找最佳路径
服务区域分析
- 在网络分析工具栏中选择Network Analyst ——新建服务区
- 网络分析窗口显示 设施点、面、线、点障碍
添加设施点
在网络分析窗口中,右键“设施点”,选择加载位置,从加载自对话框中加载设施点图层。
图层属性
- 分析设置——阻抗,按照“分钟”、“米”来查找服务区范围,
- 在默认中断中输入框中输入设置的条件,如要求设施点分别生成1、2min范围内的服务范围,在输入框中输入1,2 数字用空格或“,”逗号隔开。
- 点击网络分析工具条上的求解,可以得到服务范围
创建网络分析数据集
- shp数据的网络数据集仅支持单一线数据,基于shp文件的网络数据集,只能有一个shp线文件参与
- 地理数据库可以支持多线数据
交点处连通
- 按照边线连通的方式来连通
- 交汇点在网络数据集中默认不显示(如果想显示对网络数据集的图层进行符号显示——交汇点)
依边线连通
- 如果边线连通策略是“任意节点”,那么则会报错——独立用户定义交汇点呗检测到。这是因为他们没有在折点上。
2. 如果边线连通策略是“端点”,那么则会报错——独立用户定义交汇点呗检测到。这是因为他们没有在端点上。
注意
- 作为分析的点,必须将其绘制在线的折点上,否则,就不要让其参与构建网络数据集,仅让它作为网络位置点即可。
- 因为孤立的点是无法到其他的位置的,也就是所谓的分析失败
时空数据
- 包含地理位置的时间、日期信息
- 可借助此信息对实时观测结果和以前记录的观测结果进行追踪
- 这些观测结果可以是离散的(闪电),也可以是连续的(货运路线和飞行路线)
追踪
- 是同一个对象观测的集合
- 在任何情况下,追踪都是通过聚合具有单个追踪ID的单个实体的观测形成的。
追踪线
- 一条连接追踪中的各个观测的线
- 追踪线适用于描绘实体的大致路径
观测
- 一组在特定时间点为某个实体测量的值
- 对于要用于进行追踪的观测,其必须具有关联的时间
- 一个追踪图层包含一组观测
时间窗
追踪事件在地图上显示的时间段
操作
- 某个追踪事件满足操作触发器的条件时发生的自定义处理
- 为追踪图层定义图层操作
- 为实时追踪服务定义服务操作
触发器
- 为执行相应操作,某个追踪事件必须满足一组条件
- 可根据属性或位置条件,或两者的组合组合构建触发器
Tracking Analyst
- 是基于时间序列的可视化和分析工具
- 可以实现带有时间属性的事物和现象变化的历史回放
- 实时数据的动态显示
Tracking Analyst数据
- 在Tracking Analyst 中,首先要将时间数据添加为 Tracking 图层,这是 Tracking Analyst 所独有的。
- 可以添加 Tracking Analyst 图层实现历史数据回放的数据源包括
Shapfile
个人地理数据库
文件型地理数据库
ArcSDE
Tracking Server Connection
GPS Connection
- 所有数据源都必须包括 Data_Time 字段,
- 如果回放的数据是连续的额,具备轨迹,则数据源必须包含 EventID字段以将时间数据组织成轨迹。
- 可接受来自实时源和固定时间源的三种数据结构
简单事件
复杂静态事件
复杂动态事件
简单事件
- 时间观测组是数据的唯一组件,至少必须包括观测的时间和日期
- 包含简单事件的固定时间数据可用一个表格进行组织
- 该表将包括日期以及任何其他存在的属性
- 简单事件在单个组件中包括Tracking Analyst 用于事件处理和显示所需的所有元素
复杂事件:
- 包括两个组件,即观测组件和对象组件
- 时间观测组件不包括对象的所有必要信息,因此附加信息保存在对象组件中
- 对象组件的实际内容取决于被追踪的对象是移动对象还是静止对象。理想情况下,对象组件应包括所有静态属性
- 对象组件可能包含静态事件的形状字段。它至少应包括ID字段,可通过该字段将其链接到观测组件。
复杂静态事件
其地理位置及其他静态信息存储在时间对象组件中。时间对象组件还包括传感器ID,这样就可链接到正确传感器的观测。
复杂动态事件
- 其地理位置不断改变,因此必须连同日期和时间信息一起保存在观测对象中
- 时间对象表可能包括飞机的品牌和型号、飞机驾驶 员与机组成员的信息,以及机身年龄与容量等信息
通过Tracking Analyst可实现的基本功能
- 通过将包含日期和时间(时态数据)的地理数据以追踪图层的形式添加到地图中,可使此类地理数据更加生动形象;
- 实时追踪对象,Tracking Analyst支持与全球定位系统(GPS)设备及其他追踪和监视设备进行网络连接,从而可以实时将数据绘制成图;
- 使用时间窗及其他专用于查看随时间变化的数据的选项对时间数据进行符号化;
- 使用TrackingAnalyst回放管理器回放时间数据,可使用不同的速度进行正向和反向数据回放;
- 通过创建数据时钟来分析时间数据中存在的模式;
- 针对时间数据创建和应用操作;
- 使用Tracking Analyst动画工具可通过动画形式呈现数据;
- 使用ArcGlobe在3D模式下查看追踪数据。
空间分析的先决条件
- 加载空间分析模块
- 为分析结果设定工作路径、单元大小、分析范围、坐标系统
设置单元大小
- 栅格数据是由单元组成
- 单元是代表区域特定部分的方块
- 单元按行列排列,组成一个笛卡尔坐标系,并且所有的单元是同样的大小
捕捉栅格
- 设置栅格数据集捕捉范围
- 输出的所有栅格数据单元与指定的栅格单元匹配
掩膜
- 选择地理处理——环境——栅格分析——掩膜
- 选择已经创建的掩膜栅格数据
- 设置分析掩膜后,所有的分析只在掩膜范围内进行
距离制图
- 根据每一个栅格相距其最邻近要素(也称“源”)的距离分析制图,从而反应每一栅格与其最邻近源的相互关系
- 通过距离制图可以获得很多相关信息,对资源的合理规划和利用
距离
- 在空间分析中,不再只是单一的代表两点间的直线长度。
- 函数距离是描绘两点间距离的一种函数关系,如时间、摩擦、消耗
源
- 源即距离分析中的目标或目的地
- 源表现在GIS数据特种上就是一些离散的点、线、面要素。
- 要素可以邻接,但属性必须不同。源可以用栅格数据表示,也可以使用矢量数据表示
成本
- 达到目标、目的地的花费,包括钱、时间、人们的喜好
- 影响成本的因素可以只有一个,也可以有多个
- 成本栅格数据记录了每一单元的通行成本
- 成本数据的制作一般是基于重分类功能完成
- 需要制定统一的成本分类体系,对单个成本按其大小分类,并对每一类别赋予成本量值
- 通常成本高的量值小,成本低的量值大。
- 最后根据成本影响程度确定单个成本权重,依权重百分比加权求和,得到多个单成本因素综合影响的成本栅格数据
成本距离加权数据
- 成本距离加权数据也称成本累计数据,记录每个栅格到距离最近、成本最近的源的最少累加成本
- 成本距离加权考虑到了事物的复杂性。
直线距离(欧式距离)
- 通过直线距离函数,计算每个栅格与最近源之间的欧式距离,并按距离远近分级
- 直线距离可以用于空气污染影响度分析,寻找最近医院,计算距最近超市的距离等操作。
- 最大距离计算在输入的距离范围内进行,距离以外的地方直接赋予空值,不作任何计算,如果没有输入任何值,计算在整个图层范围内进行
区域分配
- 通过分配函数将所有栅格单元分配给离其最近的源
- 单元值储存了归属源的标识值
- 最大距离计算在输入的距离范围内进行,距离以外的地方直接赋予空值,不作任何计算,如果没有输入任何值,计算在整个图层范围内进行
成本距离
- 通过成本距离加权函数,计算出每个栅格到距离最近、成本最低源的最少累加成本。
- 同时可以生成两个相关输出成本方向数据和成本分配数据。
- 成本距离加权数据表示了每一个单元到它最近源的最小累计成本。
- 成本方向数据表示了从每一单元出发,沿着最低累计成本路径达到最近源的具体路线。
- 成本分配数据记录了么个单元的隶属源(归属于哪个源)信息。
最短路径
- 通过最短路径函数获取从一个源或一组源出发,到达一个目标地或一组目标地的最短直线路径或最小成本路径。
- 最短路径分析可找到通达性最好的路线,或找出从居民地到达超市的最优路径
- 三种最短路径计算方法
- Each Cell为源中每一个单元点寻找一条成本最小路径
- Each Zone为每个源寻找一条成本最小路径
- Best Single为所有源找寻一条成本最小路径,此时,只有一个源与一个相应的目标点或目标组相连
最短路径的找寻
- 需要获取成本数据
- 执行成本加权距离函数
- 获取成本方向数据和成本距离数据
- 通过执行最短路径功能获取最短或最优路径
密度制图
- 密度制图根据输入的要素数据集计算整个区域的数据聚集情况,从而产生一个连续的密度表面
- 密度制图主要是基于点数据生成的,以每个待计算格网点为中心,进行圆形区域搜索,进而来计算每个格网点的密度值
- 从本质上讲,密度制图是一个通过离散采样点进行表面内插的过程,根据内插原理的不同,分为核函数密度制图和简单密度制图
核函数密度制图
- 核函数密度制图中,落入搜索区域内的点具有不同的权重,靠近网格搜索区域中心的点或线会被赋予较大的权重
- 随着其与网格中心距离的加大,权重降低。
- 他的计算结果分布较平滑
简单密度制图
- 线密度制图是在密度制图中,落在搜寻区域内的线有同样的权重,先对其进行求和,再除以搜索区域的大小,从而得到每个点的密度值。
- 点密度制图是在密度制图中,落在搜寻区域内的点有同样的权重,先对其进行求和,再除以搜索区域大小,从而得到每个点的密度值。
Population字段
- 选择参与密度计算字段。
- 默认选项为
- 计算圆内要素点个数计算密度值
栅格插值
- 一般情况下采集到的数据是以离散点的形式存在的
- 只有在这些采样点上才有较为准确的数值,其他采样点上都没有数值
- 在实际应用中可能需要用到某些为采样点的值,这个时候就需要通过已采样点的值
- 插值结果将产生一个连续的表面,在这个连续表面上可以得到每一个点的值。
- 栅格插值包括简单栅格表面的生成和栅格数据重采样
反距离权重插值
- IDW是一种常用而简便的空间插值方法,它以插值点与样本点间的距离为权重进行加权平均,离插值点越近的样本点赋予的权重越大。
- IDW通过对邻近区域的每个采样点值平均运算获得内插单元值。
- IDW是一个均分过程,这一方法要求离散点均匀分布,并且密度程度足以满足在分析中反映局部表面变化
Z值字段
- 选择参加内插计算的字段名称
幂文本框
输入IDW的幂值,幂值是个正实数,其缺省值为2
搜索半径类型——变量
- 可变搜索半径。内插计算时样本点个数是固定的(缺省值为12)
- 搜索距离是可变的,取决于插值单元周围样本点的密度。密度越大,半径越小。
- 如果在最大距离文本框中输入最大搜索半径值,若某一领域的搜索半径在获得指定数据的样本点之前,已经达到了最大搜索半径。该点的插值就通过最大搜索半径内的已有样本点来完成。
搜索半径类型——固定
- 固定搜索半径。需要规定插值时样本点的最小数据和搜索距离。
- 搜索距离是一个常数,对每一个插值单位来说,用于寻找样本点的圆形区域的半径都是一样的。
- 如果搜索半径距离内的点个数小于插值点个数的最小整数值,则搜索半径自动增大。
输入障碍折线要素
- 用于指定指定igyie中断线文件
- 中短线是指限制搜索输入样本点的多线段数据集。
- 是一个打断表面的线特征悬崖、峭壁或某些障碍
- 中断线不必具有Z值
- 他限制了插值计算,使得只能在线的两侧各自进行。而落在中断线上的点同时参与两侧的计算。
样条函数插值
- Regularized Spline(规则样条)——生成一个平滑、渐变的表面,插值结果可能会超出样本点的取值范围较多
- Tension Spline(张力样条)——根据要生成的现象的特征生成一个比较坚硬的表面,插值结果更接近限制在样本点的取值范围内
- 计算过程中出了需要选择不同的计算方法,还需要在每种方法中设定一个合适的权重(weight)。
- 规则条样插值时,权重越高表面越光滑,通常用到的典型值有0、0. 001、0. 01、1和5
- 张力条样插值时,权重越高,表面越粗糙,通常用到的典型值有0、1、5和10。
克里金插值及基本原理
- 是一种基于统计学的插值方法
- 基本原理是根据相邻变量的值,利用变异函数揭示的区域化变量的内在联系来估计空间变量数值
克里金插值步骤
- 对已知点进行结构分析,在充分了解已知点性质的前提下,提出变异函数模型
- 在该模型的基础上,进行克里金计算
普通克里金插值
- 最普通、应用最广
- 假定采样点值不存在潜在的全局趋势,只用局部的因素就可以很好的估测未知值
通用克里金插值
- 假设存在潜在趋势,可以用一个确定性的函数或多项式来模拟
- 通用克里金方法仅用于数据的趋势已知并能合理而科学的描述
自然邻域法插值
- 使用附近点的值和距离预估每个像元的表面值,该插值也称为Sibson或区域占用(area-stealing)插值
- 与反距离权重插值法不同的是,使用Voronoi(泰森)多边形进行空间划分
- 每个插值点的计算来自于其邻近的相邻多边形的点以及由插值点形成的心的泰森多边形与原始多边形的重叠区域所占比重作为插值权重
- 该插值方法具有局部性,仅使用查询点周围的样本子集
- 根据输入数据的结构(泰森多边形)进行局部调整,无需用户指定搜索半径样本个数等信息
- 该插值方法不会推断趋势且不会生成输入样本尚未表示的山峰、凹地、山脊或山谷。
- 该表面将通过输入样本且在除输入样本位置以外的其他所有位置均是平滑的。
趋势面法插值(Trend)
- 可通过全局多项式插值法将由数学函数(多项式)定义的平滑表面与输人采样点进行拟合。
- 趋势表面会逐渐变化,并捕捉数据中的粗尺度模式。
- 使用趋势插值法可获得表示感兴趣区域表面渐进趋势的平滑表面。
趋势面法插值适用情况
- 感兴趣区域的表面在各位置间出现渐变时,可将该表面与采样点拟合,例如污染扩散情况
- 检查或排除长期趋势或全局趋势的影响
注意
- 在趋势插值法中,将通过可描述物理过程的低阶多项式创建渐变表面如污染情况和风向
- 使用的多项式越复杂,为其赋予物理意义就越困难
- 计算得出的表面对异常值(极高值和极低值)非常敏感,尤其是在表面的边缘处。
趋势插值法——线性
- 线性趋势面插值法用于创建浮点型栅格
- 将通过多项式回归将最小二乘表面与各输人点进行拟合。使用线性选项可控制用于拟合表面的多项式阶数
- 一阶多项式趋势面插值法将对平面与一组输人点进行最小二乘拟合。利用趋势面插值法可创建平滑表面。
- 一阶多项式趋势面插值法生成的表面几乎不能穿过各原始数据点,因为对整个表面执行的是最佳拟合
- 如果所用多项式的阶数高于- -阶,插值器所生成栅格的最大值和最小值可能会超过输人要素数据输人文件中的最小值和最大值。
趋势插值法——逻辑型
- 可生成趋势面的逻辑型选项适用于预测空间中给定的一组位置(x, y)处某种现象存在与否(以概率的形式)
- z值是仅会产生两种可能结果的分类随机变量如濒临灭绝的物种存在与否
- 生成的两种z值可分别编码为1和0
- 逻辑型选项可根据值为0和1的各像元值创建连续的概率格网。可使用最大可能性估计直接计算出
实现过程中
- 多项式的阶,该值介于1-12的整数,选择值1会对点进行平面拟合,选择高值会拟合更为复杂的曲面,默认值是1
数据重采样
- 栅格插值除了包括简单栅格表面的生成还应包括栅格数据重采样
- 重采样是栅格数据空间分析中,处理栅格分辨率匹配问题的常用数据处理方法。
- 用来分析的数据资料由于来源不同,经常会出现不同栅格大小的问题。这时为了便于分析,就需要统一栅格大小的转换处理,即栅格数据的重采样过程。
数据重采样——最邻近法采样(NEAREST)
- 用输入栅格数据中最邻近栅格值作为输出值。
- 在重采样后的输出栅格中,每个栅格值,都是输入栅格数据中真是存在而未加任何改变的值
- 这种方法简单易用、计算量小,而且速度最快
数据重采样——双线性采样(BILINEAR)
取内插点(x,y)点周围四个临点,在y方向(或x方向)内插两次,再在x方向(或y方向)内插一次,得到(x,y)点的栅格值。
数据重采样——三次卷积采样(CUBIC)
- 是进一步提高内插精度的一种方法
- 他的基本思想是增加邻点来获得最佳插值函数
- 取内插点周围相邻的16个样点数据,可以在某一方向上内插,每四个值一次内插四次,再根据四次的计算结果,在另一个方向上内插,最终得到内插结果
表面分析
- 通过时生成新数据集,获得更多的反应原始数据集中所暗含的空间特征、空间格局等信息。
- 表面分析的主要功能
- 查询表面值
- 从表面获取坡度和坡向信息
- 创建等值线
- 分析表面的可视性
- 从表面计算山体的阴影
等值线绘制
- 等值线是将表面上相邻的具有相同值的点连接起来的线
- 等值线分布的疏密一定程度上表明了表面值的变化情况
- 等值线越密,表面值的变化越大,反之越小
- 通过研究等值线,可以获得对表面值变化的基本趋势
因子分析方法
- 因子分析方法是GIS空间分析,尤其是GIS数字地信分析常用的基本分析方法。
- 不同的地形因子从不同侧面反映了地形特征
- 从地形因子所描述的空间区域范围,常用地形因子可以划分为围观地形因子和宏观地形因子
- 按照地形因子差分计算的阶数,地形因子分为一阶地形因子、二阶地形因子和高阶地形因子
- 坡度、坡向、平面曲率、剖面曲率咋ArcGIS中可以直接获取。
坡度
地表面任一点的坡度(slope)是指过该点的切平面与水平地面的夹角
在实际应用中坡度的表示方法
- 坡度既水平面与地形面之间夹角
2. 坡度百分比既高程增量与水平面增量之比的百分数
- 坡度中——Z因子,中输入高程变换系数,一般用于平面读数单位与高程度量单位不一致的情况
坡向
- 坡向是指地表面上一点的切平面的法线矢量在水平面的投影与过该点的正北方向的夹角
- 对于地面任何一点来说,坡向表征了该点高程值该变量的最大变化方向。
输出坡向数据规定
正北方向为0°,按顺时针方向计算,取值范围为0°-360°。
地面曲率
- 对地形表面一点扭曲变化程度的定量化度量因子
- 地面曲率在垂直和水平两个方向上的分量分别称为剖面曲率和平面曲率
剖面曲率
- 是对地面坡度的沿最大迫降方向地面高程变化率的度量
平面曲率
- 指在地形表面上,具体到任何一点,指过该点的水平面沿水平方向切地形表面所得的曲线在该点的曲率值
- 平面曲率描述的是地表曲面沿水平方向的弯曲、变化情况,也就是该点所在的地面等高线的弯曲程度。
山体阴影
- 山体阴影是根据假想的照明光源对高程栅格图的每个栅格单元计算照明值。
- 山体阴影图不仅很好的表达了地形的立体形态,而且可以方便的提取地形隐蔽信息
- 计算过程中包括三个重要参数太阳方位角、太阳高度角和表面灰度值
太阳方位角
- 以正北方向为0°,按顺时针方向度量
- 由于人眼的视觉习惯,默认方位角为315°,即西北方向
太阳的高度角
- 光线与水平面之间的夹角,同样以度为单位
- 为符合人眼视觉习惯,通常默认为45°。
- 默认情况下,ArcGIS中提取的光照灰度表面值的范围为0-255
像元统计
- 多层面栅格数据叠加分析时,经常需要以栅格像元为单位来进行像元统计分析。
- 像元统计输入数据集必须是来源于同一个地理区域,并且采用相同的坐标系统。
- 像元统计功能常用于同一地区多时相数据的统计,通过像元统计分析得出所需数据。
邻域分析
- 邻域统计是以待计算栅格为中心,向其周围扩展一定范围,基于这些扩展栅格数据进行函数运算
- 邻域统计是在单元对应的邻域范围指定的单元上进行统计分析,然后将结果值输出到该单元位置
四种邻域分析窗口
- 矩形,需要设置矩形窗口的长和宽,缺省的邻域大小为3*3单元
- 环形,需要设置邻域的内半径和外半径。半径通过和x轴或y轴的垂线的长度来指定。落入环内即内外半径之间环的数值将参与邻域统计计算,内半径以内的部分不参与计算。
- 圆形,只需要输入圆的半径
- 楔形,需要输入起始角度、终止角度和半径。起始角度和终止角度可以是0-360的整形或浮点值。角度值从x轴的正方向零度开始,逆时针逐渐增加直至走过一个满圆又回到零度
邻域统计
- 是在单元对应的邻域范围指定的单元上进行统计分析,然后将结果值输出到该单元的位置
- 利用邻域统计可以获取多种信息。如在调查土地利用是,邻域统计可以获得邻域范围土地变化和确定土地利用的稳定性。
- 利用邻域统计的平均值还可以进行边缘模糊等多种操作
分类区统计
- 以一个数据集的分类区为基础,对另一个数据集进行数值统计分析。包括计算数值取值范围、最大值、最小值、标准差
- 一个分类区就是在栅格数据中拥有相同值的所有栅格单元,而不考虑他们是否邻近
- 分类区统计是在每一个分类区的基础上运行操作的。
分类区统计操作注意
- 区域字段——选择表示分类区类别的字段,若是栅格数据则默认为value,即栅格单元值
- 在计算中忽略NoData——可选项,标示是否允许栅格数据中的空值参与运算,选中表明允许包含空值的单元参与运算
以表格显示分区统计
- 可以把结果以表格的形式输出
- 区域分析——以表格显示分区统计
- 统计结束后该表自动加载到ArcMap内容表中,以按源列出形式显示。
重分类
- 基于原有数值,对原有数值重新进行分类整理从而得到一组新值并输出
- 新值替换——用一组新值取代原来值
- 旧值合并——将原值重新组合分类
- 重新分类——以一种分类体系对原始值进行分类
- 空值设置——把指定值设定空值
栅格计算
- 是数据处理和分析的最常用方法,也是建立复杂的应用数学模型的基本模块
- 不仅可以完成基于数学运算符的栅格运算,以及基于数学函数的栅格运算,还可以支持直接调用ArcGIS自带的栅格数据空间分析函数。并可以方便的实现多条语句的同时输入和运行
- 支持地图代数运算,栅格数据集可以作为算子直接和数字、运算符、函数等在一起混合计算,不需要做任何转换
数学运算
- 具有相同输入单元的两个或多个栅格数据逐单元进行
- 算数运算符——加、减、乘、除
- 布尔运算符——和(&)、或(|)、异或(!)、非(^)。基于布尔运算来对栅格数据进行判断
判断为真,输出 1
判断为假,输出 0
- 关系运算——以一定关系条件为基础
符合条件的为真,赋予1
不符合条件的为真,赋予0符合条件的为真,赋予1
关系运算符包括六种
= , < , > , <> 不等于, >= , <=
- 算数函数
- Abs (绝对值函数)
- Int (整数函数)
- Float(浮点函数)
- Ceil(向上舍入函数)
- Floor(向下舍入函数)
- IsNul(输入数据为空数据以1输出,有数据以0输出)
- 三角函数
- Sin
- Cos
- Tan(正切)
- Asin(反正弦)
- Acos
- Atan
- 对数函数
- Exp(底数 e )
- Exp10
- Exp2
- Log(自然对数)
- Log10
- Log2
- 幂函数
- Sqrt(平方根)
- Sqr(平方)
- Pow(幂)
简单算术运算
- “-”和“^”是单目运算符,运算符前可以不加内容,而只在运算符后加入参与计算的对象
- 在公式编辑器如果引用“图层和变量”选择框的数据层,数据层名必须用双引号括起来
数学函数运算
- 在函数后面的括号内加入计算对象
- Mod 是对栅格数据进行求模运算
多元分析
- 空间分析有两种类型的多元分析——“分类”和“主成分分析(PCA)”
- 分类
- 将研究区域中的每个像元都分配各类或目录,包括“监督分类”和“非监督分类”
- 监督分类——需要了解研究区域的具体情况,并且可以识别每个类的代表性区域或样本
- 非监督分类——使用数据中自然产生的统计分组来确定将数据分入那个聚类
ISO聚类
- ISO聚类,即迭代式自组织聚类方法,是最常用的非监督分类算法
- 先设定初始聚类中心和聚类数,然后定义相似度准则函数,对全部样本进行调整。
- 调整完毕后重新计算样本均值作为新的聚类中心。
- 每次迭代期间将所有像元分配给现有的聚类中心,计算最小欧式距离,将各个像元聚集到多维属性空间中最接近的平均值,并为每个聚类中心重新计算新的平均值
- 通过多次的合并与分裂过程最终完成对像元的聚类分析,从而得到类数比较合理的聚类结果
#注意
ISO聚类的过程通常需要制定的最佳聚类数是未知的,建议输入一个较大的数,分析所生成的聚类,然后使用较少的类数重新执行函数
ISO聚类工具
- 使用ISODATA聚类算法来确定多维属性空间中像元自然分组的特征
- 可将结果储存在输出的ASCII特征文件中,但是不能产生分类结果
- 特征文件中包含关于所表示聚类的像元子集的多元统计信息
- 计算结果可以确定出像元位置与聚类之间的所属关系、聚类的平均值以及方差协方差矩阵
- 影响分类中通常使用“ISO聚类非监督分类”方法
ISO聚类操作过程
- 输出特征文件——指定输出的特征文件,特征文件是用于存储感兴趣的每个类或聚类的多元统计信息的ASCII文件
- 后缀名为*. GSG文件
- 文件包括每个类的平均值、类中像元的数目以及类的方差及协方差矩阵
- 类数目——在聚类过程中可能产生的最大聚类数
- 迭代次数——(可选)该值应该足够大,以保证像元从一个类迁移至另一类的次数最少,从而是所有的聚类编程稳定状态。
- 迭代次数应随着“类数目”的增加而增大
- 最小类大小——(可选)指一个有效类所含的最少栅格数
- 采样间隔——(可选)指相邻两次采样的空间间隔,采用间距过大会损失重要信息,间距设置过小会增加计算量
最大似然分类
- 是基于贝叶斯准则的分类错误概率最小的-一种非线性分类,是应用比较广泛和比较成熟的一种监督分类方法。
- 最大似然法分类基本原理是:假定训练样本中地物的光谱特征和自然界大部分随机现象一样,近似服从正态分布
- 利用训练样本可求出各类均值、方差及协方差等特征参数,从而可求出总体的先验概率密度函数
- 在以上步骤的基础上,对于任何-一个像素,可反过来求它属于各类的概率,取最大概率对应的类为分类结果
- 当总体分布不符合正态分布时,其分类可靠性将下降,这种情况下不宜采用最大似然分类法。
自然分类法步骤
- 在最大似然分类中需要特征文件
- 将各个像元指定给以特征文件表示的类时,同时考虑类特征的方差和协方差
- 假设类样本呈正态分布,可使用均值向量和协方差矩阵作为类的特征。
- 如果给定了每个像元值的这两个特征,则可计算每个类的统计概率,以确定像元能否作为该类的成员
“先验概率权重”参数
- 当“先验概率权重”为EQUAL时,每个像元将被分配给它最有可能具有成员资格的类
- 当“先验概率权重”为FILE时,需要同时输入先验概率文件。表示某些类出现的可能性大于(或小于)平均值,具有特殊概率的类的权重在先验概率文件中指定
- 先验概率文件有助于对处于两个雷的统计重叠内的像元进行分配,这些像元会更精确的分配给相应的类,从而获得更理想的分类。这种重分类方法就是贝叶斯分类法
- 当“先验概率权重”为SAMPLE时,在特征文件中进行采样的所有类所分配到的先验概率与按各个特征捕获的像元数量成正比
当像元数少于样本平均值的类所获得的权重将小于平均值
当像元数大于样本平均值的类所获得的权重将大于平均值。
结果相应类所分配到的像元数有多有少
最大似然法——分类置信度
- 在最大似然法分类中可生成置信栅格数据,来显示分类置信度,共有14类
- 在置信栅格数据中像元值为1的置信度中所包含的像元与输入特征文件中所存储的任意均值向量距离最短,表示这些像元的分类具有最高确定性
- 在置信栅格中最低的置信度值是14,表示显示的像元进行分类可能性最小
- 分类置信度与有效剔除分数值的个数直接关系,当[剔除分数]为0. 99或更小时,才会对第二个置信度所包含的像元(在置信栅格中像元值为2)进行分类
- 当[剔除分数]为0. 005或更大,将不对此置信度的像元进行分类。
剔除分数
- 选项将因最低正确分配概率而得不到分类的像元部分
- 默认值为0. 0,将对每个像元进行分类
- 有效输入值包括0. 0、0. 005、0. 01、0. 025、0. 05、0. 01、0. 25、0. 5、0. 75、0. 9、0. 95、0. 975、0. 99和0. 995
输入概率权重
- 选项只有当先验概率权重选择FILE类型所输入的文件
- 输出置信栅格
- 表示以14个置信度显示分类确定性的输出置信栅格数据集,其中,最低值表示的确定性最高
主成分分析
- 将输入的多波段数据变换到一个新的空间,其是对原始空间轴进行旋转二成新的多元属性空间
- 是在尽量不丢失信息的前提下的一种线性变换方法,主要用于数据压缩和信息增强
方法介绍
- 此方法生成的是波段数与指定的成分数相同的多波段栅格(新多元空间中每个轴或成分一个波段)
- 第一个主成分将具有最大的方差,第二个主成分将具有未通过第一个主成分描述的第二大方差
- 多数情况下,主成分工具生成的多波段栅格中的前三个或前四个波段将对95%以上的方差进行描述,就可以将其余栅格波段删除
- 删除的理由是——新的多波段栅格所包含的波段数较少,而且95%以上的原始多波段栅格方差保持不变,因此计算速度更快,同时还保持了精度。
输出数据文件
(可选),文本文件,其中存储主成分参数,输出文件的扩展名为. txt或. asc
树状图
- 表示连续合并的每对类之间属性距离的逻辑示意图。
- 为避免交叉,以图形的方式进行排布,使得要合并的每对类的成员在示意图中相邻。
等级聚类算法
- 原理——首先计算输入特征文件中每对类之间的距离,以迭代方式合并最近的的一对类,完成后继续合并下一对最近的类,直到合并完所有的类。
- 在每次类合并后,对各类之间的距离进行更新。合并类特征时采用的距离将用于构建树状图。
地统计分析(Geostatistics)
- 以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或具有空间相关性和依赖性的自然现象的一门科学。
- 与空间数据的结构性和随机性、空间相关性和依赖性、空间格局与变异有关的研究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性时,皆可应用地统计学
地统计学和经典统计学的共同之处
- 都是在大量采样的基础上
- 通过对样本属性值的频率分布、均值、方差等关系及其相应规则的分析,确定其空间分布格局与相关关系
地统计学和经典统计学的区别
- 地统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离
- 弥补了经典统计学忽略空间方位的缺陷
地统计分析理论基础
- 提前假设
- 区域化变量
- 变异分析
- 空间估计量
前提假设——随机过程
- 地统计学任伟研究区域中所有的样本值都是随机过程的结果,即所有样本值都不是相互独立的,是遵循一定的内在规律的
- 地统计学就是要揭示这种内在规律,并进行预测
前提假设——正态分布
- 在统计学分析中,假设样本是服从正态分布的,地统计学也不例外
- 在获得数据后,首先应对数据进行分析,若不符合正态分布的假设,应对数据数据进行变换,转换为符合正态分布的形式,并尽量选取可逆的变换形式
前提假设——平稳性
- 对于统计学而言,重复的观点是其理论基础
- 统计学认为,从大量的重复的观察中可以进行预测和估计,并可以了解估计的变化性和不确定性。
- 对于大部分的空间数据而言,平稳性是假设是合理的
- 两种平稳性
- 均值平稳——即假设均值是不变的并且与位置无关
- 与协方差函数有关的二阶平稳——假设具有相同的距离和方向的任意两点的协方差是相同的,协方差只与这两点的值相关而与他们的位置无关
- 与变异函数有关的内蕴平稳——假设是指具有相同距离和方向的任意两点的方差(即变异函数)是相同的。
- 二阶平稳和内蕴平稳都是为了获得基本重复规律而作的基本假设,通过协方差函数和变异函数可以进行预测和估计预测结果的不确定性
区域化变量
- 当一个变量呈现一定的空间分布时,称之为区域化变量,它反映了区域内某种特征或现象
- 区域化变量与一般的随机变量不同之处在于(它是与位置有关的随机变量)
一般的随机变量取值符合一定的概率分布
区域化变量根据区域内位置的不同而取不同的值。
当区域化变量在区域内确定位置取值时,表现为一般的随机变量
- 在实际分析中,重采用抽样的方式获得区域化变量在某个区域内的值,即此时区域化变量表现为空间点函数
区域化变量的特征
- 随机性
- 结构性
- 区域化变量是一个随机变量,它具有局部的、随机的、异常的特征
- 区域化变量具有一定的的结构特点,即变量在点x与偏离空间距离为h的点x h 处的值Z(x)和Z(x h)具有某种程度的相似性,即自相关性。
- 自相关性的程度依赖于两点间的距离及变量特征。
- 空间局限性——这种结构性表现为一定范围内
- 不同程度的连续性
- 不同程度的各向异性——各个方向表现出的自相关性有所区别
协方差函数
地统计学的协方差函数可表示为
Z(x)为区域化随机变量,并满足二阶平稳假设,即随机变量Z(x)的空间分布规律不随位置而改变
h为两样本点空间分割距离
Z( ) 为 Z(x) 在空间点 处的样本值
Z( h) 为 Z(x)在 处距离偏离 h 的样本值[i=1,2,…,N(h)]
N(h)为分割距离为h时的样本点对总数
代码语言:javascript复制和 分别为 和 的样本平均数
1
n为样本单元数
一般情况下 (特殊情况下可以认为近似相等)
半变异函数
- 又称半变差函数、半变异矩,是地统计分析的特有函数
- 区域化变量Z(x)在点x和x h处的值Z(x)与Z(x h)差的方差的一半称为区域化变量Z(x)的办变异函数,记为r(h)。2r(h)称为变异函数。
- 根据定义有
r(x,h)= Var[Z(x)-Z(x h)]
- 区域化变量Z(x)满足二阶平稳假设,因此对于任意的h有
E[Z(x h)]=E[Z(x)]
- 因此半变异函数可以改写为
r(x,h)= E
变异分析
- 半变异函数和协方差函数把统计相关系数的大小作为一个距离的函数,是地理学相近相近相似定理的定量化