下一代计算:空间计算

2018-02-12 14:50:52 浏览数 (2)

空间计算涵盖诸多内容,从概念、应对措施、工具、技术到系统,这些东西让我们对“位置”有了新的理解,极大地改变了我们的生活。新的变化包括:我们该如何理解自己与位置信息之间的关系,如何沟通并可视化位置信息,以及如何使用导航功能。通过无处不在的全球定位系统(GPS),无论是在国家公园里的徒步旅行者、湖面上的荡舟者、到了新地方的孩子们、计程车(或Uber司机、自动驾驶汽车),还是无人飞机,都能对自己所在的位置、附近的设施以及去往名胜古迹的路线了如指掌。

要点概括

  • 随着民用GPS的普及,通过诸如谷歌地图、Uber服务、地理位置标签、地域指向性服务等定位服务,空间计算极大地丰富了民众的生活;
  • 空间数据库、空间统计、空间数据挖掘之类的概念,让计算机科学得到进一步增强;
  • 未来机会无限:通过无处不在的室内定位服务、物联网定位、全球持续监控、可视化、预测及警报,像气候变更,食物、能量、水源的提供等社会化问题都会得到解决。

大型公司通过空间计算来执行选址、跟踪资产、管理设施、导航与管理物流;科学家使用全球导航卫星系统GNSS(比如全球定位系统GPS)来跟踪濒危物种,更好地了解动物行为;农民使用这种技术增加作物产量,降低开销;学生通过虚拟地球仪(比如谷歌地球、NASA地球放大镜)以积极参与的互动方式了解周边区域乃至全球。近来在自然灾难(比如2012年的桑迪飓风)发生后,有成千上万的人访问谷歌地球,协助灾后重建。2010年海地地震后,多亏了志愿者及时提交的当地信息,相关人士才能制出灾后路线图。

未来十年,空间计算还将带来一系列变革。比如,在搜索路线时一般会选择在时间或距离上最短的那条,不过有公司在测试新的方式:环境路线选择——选择耗油量最低、尾气释放最少的方案。目前,回避左转的智能路径选择让快递公司UPS每年节省超过300万加仑的燃油,如果环境路线选择方案可用的话,带来的影响必然是量以倍计的。

随着移动电话的普及,世界各类信息的汇集成为了可能。有研究发现,根据移动电话所内置的运动传感器,在地震发生的几秒内就能探测到相关信息。而导航公司也越来越多地通过移动电话来记录道路上的交通状况。人们通过信息化基架协助对地球这个复杂系统的理解,这类的需求也越来越大。技术进步极大地降低了人们从实地、从实验室以及从模拟地球系统中收集数据的难度,不但使得地学数据呈现指数式增长,还显著提高了我们对地球系统模型中多元化现象的适应能力。对于我们理解地球的变化,理解物理学、生物学、社会学来说,这种进步可能是至关重要的。

近十年来,特别是在地理环境领域,空间计算方面的工作已经非常广泛,由于涉及了大规模的跨学科交流,其深度及广度单用一篇文章是难以描述的。本文有两个目标:一是分享我们基于2012计算社区联盟研讨会的讨论结果;二是开启新一轮讨论:拓展规模后的计算联盟在这个跨学科领域将扮演什么角色。下面将会通过几个研讨会上例子进行描述,它们彼此间不分次序,也不是全面的,更多案例请查看原文附注。最后我们提倡对跨学科领域提供支持,不限于本文案例中的那些。下面将用数据来进行说明。

革命性的成果

空间计算最初是为了对地图及其他地理数据进行计算和分析,其影响集中在高度专业化的学科领域(表一)。从那时起,空间计算技术的一系列变革已经深深地融入人类社会,协助我们回答各种各样的问题。下面将简单描述几个应用程序,还有影响重大而深远的研究成果,想要查看更多内容,请参考原文附注中的文章。

表一

全球定位系统(GPS):我在地表什么地方?在18世纪,“经度问题”是科学领域最具挑战的问题之一。由于无法测量经度,在大航海时代,水手们一旦看不到地平线,也就意味着迷失方向。最终,人们靠着罗盘、地图、星座还有航海经线仪(一种计时器),即使身处没有地标的大海,也能进行粗略定位了。随着1978年GPS发布并随后民用化以来,如今我们已经可以进行快速精确定位了。GPS是GNSS的案例之一,只要在4颗及以上的导航卫星覆盖下,我们就能获得位置与时间信息。基于GNSS的精确计时简化了人们的日常活动(比如电脑时钟同步)、监控移动对象的地理分布式传感网络(导弹、飞机、车辆与地壳构造板块)以及电力分配网络。有了这种定位能力,向终端用户提供基于位置的服务成为可能(比如逐向道路导航系统、本地搜索、地理位置解析)。现如今,GNSS以及相关基于位置的服务已广泛应用在商业、科学、追踪与监控领域。由于价格低廉的超大规模集成电路可以轻松集成到手机与平板电脑中,GPS系统的广泛应用成为可能。

遥感:陆地表面哪里有森林植被覆盖?在最近几十年中,随着气候变化、城镇化与人口增长,森林的覆盖情况有什么变化?之前,这些都需要实地测量才能得知,不但需要耗费大量劳动力,覆盖区域也很有限。但现在,通过遥感卫星便可在全球范围内监控陆地覆盖的变化情况。此外,通过专业工具还能感知地下资源。由于数据量巨大,计算科技在遥感数据集的存储、查询和分析方面都非常重要。同时,这些数据集也激发了像谷歌地球引擎这样的计算创新。

地理信息系统(GIS):哪些国家在朝鲜导弹的射程范围内?图一是一个著名案例,显示了在平面地图上使用球面距离所导致的距离信息计算错误,这种错误在缺乏GIS辅助球面测量的情况下很容易出现。GIS能够解读常见地理数据来源所使用的大量地图投影,协助融合不同来源的地图数据。但由于地球并非完美的球形,GIS也能解读更准确的表现方式,包括椭球体和使用陆基大地参考点定位的非参数表现方式。GIS还会对空间数据进行捕获、存储、分析、管理及可视化;例如,在飞机上的地球地图就是以曲面表现的。尽管在很大程度上,地图投影仍保有拓扑特性,不过其保留的度量属性(比如距离与面积)要取决于所使用的投影。GIS有许多独特的功能,比如制图学、大地测量学数据和地图层等;在与几何学融合之后,也能用在空间查询与统计分析方面,下面两段将会有更深入的描述。算法进步(如平面扫描算法)与数据架构(如地图渲染和地图叠加相关的不规则三角网格)将会极大地带动GIS发展。

图一

空间数据库管理系统:通过斯隆数字化巡天系统,类星体星系对可以在30弧秒内发现对方。在全球变暖引发的海平面上涨、暴风雨骤降与春雪消融等极端气候面前,最有可能被洪水淹没的房子在哪儿?在空间数据库出现前,由于2D空间数据与1D数据类型,再加上传统数据库系统使用的索引之间不匹配,这样的空间查询需要耗费长时间的计算,并引入巨大的编程工作量。此外对于多级查询来说,单纯的空间数据类型集合是不够的,因为某些查询的结果(比如不相交多边形的集合)无法自然表达为点、线与多边形。为了直观显示,同时有效回答多级并行空间查询的问题,空间数据库(如Oracle Spatial and PostGIS)引入了空间数据类型(比如OGIS的简单功能)、计算(内部与距离)、空间数据架构(比如R-tree和泰森多边形)和算法(比如最短路径、最近邻还有范围查询)。编程工作量的减少使得代码更紧致,响应时间更迅速。

空间统计:硅片哪处区域的缺陷会异常高度集中?最近是否有疾病爆发,爆发区域在何处?在1854年,斯诺医生在伦敦地图上手工绘制宽街水泵附近的霍乱爆发热点(图2a),就算是针对小区域内单一种类疾病的分析也花了若干天。如今,公共卫生机构通过旨在发现疫情与热点的(如扫描统计)空间统计测试,就可以在大范围内监控传染病评分(图2b),并将这些事件与自然变化区分开来。空间统计技术也常用于公共安全(如高犯罪地域)、超大型积体电路设计(如找出硅片缺陷集中区域)、天气预报(比如数据同化)、交通运输(比如事故多发地段)、矿业(比如克里金方法)、公共卫生(如癌症群体检测)以及农业(比如为农业普查中的精细农业与抽样设计设置管理区域)等领域。在将传统统计模型(如线性回归、皮尔森相关系数)应用到地理数据方面时,空间统计理论(如点过程、空间自相关、地址统计学)解决了独特的挑战(比如违反独立同分布假设)。尽管空间统计技术比传统的统计技术在计算与数据量上都要高出一个数量级,不过近几十年来,计算与数据技术也在逐渐趋向低价高性能,如传感器、空间数据库管理系统还有GIS,从而推动空间统计方式的采用率。

图二

最近的改变

在20世纪末,大多数的地图都是由政府机构或测绘公司中的少数精英绘制出来的。美国国防部或石油勘探公司这样的机构,使用高度专业化的软件(Esri ArcGIS与Oracle Spatial之类)来编辑分析地理信息。表2中总结了一些空间计算领域的进展,这些技术显著改善了这种状况。在移动电话普及,接入互联网的用户上涨到数十亿后,全球几乎都在使用空间技术。先驱者的成功提升了人们对空间技术的期待。同时,人们对位置信息数据滥用的担心也在逐渐增长。

表二

使用基于位置的服务和地图更新服务的人口多达数十亿:随着基于网络的技术、移动电话、智能手表、民用GPS设备以及基于位置的社交媒体的成长,基于位置的服务以及互联网服务也随之成长,将地理信息系统带到大众视野中。使用移动电话、民用GPS设备与服务的人口多达数十亿。Uber、Waze、Google Maps、Facebook签到,以及其他基于位置的社交媒体在全球范围内也有超过10亿人使用。

提供地图数据的功能多达数十亿种,能观测到的现象很多:越来越多的智能手机用户也在自愿或被动地贡献着自己的地理位置信息,直接造成了各类空间数据的分布范围更广、数量更多。由于3D地图的传感器越来越丰富,人们现在所能观察到的现象也越来越多,地图分辨率也在逐渐提升。

多个定位平台:以往来讲,空间计算支持要受到应用软件层面(比如 ArcGIS)、网络服务(比如谷歌地图和地图查询)、数据库管理(比如SQL3/OGIS)等诸多限制。近十年来,对空间计算的支持在某些级别的计算堆栈中有所体现,包括HTML5、社交媒体签到、互联网协议第六版与开放位置服务等。

由于潜力与风险巨大,预期也有所提升:基于位置的服务、导航辅助与交互式地图可以说是已经超出了用户的期望,其直观与易于使用的特性赢得了良好的声誉。空间计算在各方面潜力明显,包括减少温室气体排放、加强网络安全、提高消费者信心与解决很多其他社会问题上。然而,空间计算科技的大获成功也引发了用户的警戒心理:位置隐私的隐患必须得到解决,否则公众对于位置服务的信心会逐渐减退。

短期机遇

上面提到的这些变化影响极为深远,不但凸显出空间计算研究方面的新兴渠道,也带来了许多激动人心的新机遇。

增强现实系统:增强现实丰富了我们对真实世界的感知,通过在空间中叠加虚拟图像,影响人们的视觉,从而传达该地点或物体在过去、现在与未来的信息,如图三和图四。这种技术已经用在飞机座舱的平视显示器上,也逐渐成为智能手机应用受欢迎的功能。这种技术虽然很轻量级却功能强大,随着其普及,增强现实技术将在医学、建筑、旅游、商业、工程、城市规划、组装维护以及日常生活智能化领域扮演更重要的角色。空间计算研究领域所面临的新挑战是如何创造新算法,以及如何将其与云技术、全3D定位、人机位置估算等技术相结合。想要影响人类的所有感官(比如视觉、听觉、触觉)与控制能力(手、眼、腿等),实现在多个任务中与增强现实交互,需要怎样接入?如何以充分的自由度通过技术捕捉人体,并在虚拟空间中表示出来?

图三

图四

空间预测分析:随着过去十年来,空间统计以及空间数据挖掘方面取得了长足的进步,人们能够更精准、更及时地预测飓风的路径、疾病的传播、交通堵塞情况等。由于空间自相关性、非平稳性与边缘效应,这些问题在传统预测中难以解决。在进行针对大范围事件进行时间与空间预测时,包括肿瘤的生长趋势、飞机机翼或道路桥梁的裂纹扩散趋势等,空间模型价值重大。这一研究领域所需要回答的问题包括:如何将机器学习技术拓展到这一领域,解决存在于时间与空间上的自相关性、非平稳性、多相性与多尺度的挑战?如何挖掘频繁出现的时间与空间模式?

利用位置信息辅助系统、车队与人群:未来必然会通过定位设备,将互联网上升到万物互联,让固定基础设施与移动对象(车辆行人等)之间的互联成为可能,协助改善交通状况,比如在2013年4月洛杉矶将所有4500盏交通信号灯互相连接起来,以改善高峰时间的交通状况。通过信息来源增加,信息不再掌握在少数人手中,司机、智能汽车还有基础设施都可能在减少拥堵、快速疏散、增强安全性诸方面起到作用。这种合作模式对“信任”提出了挑战:即要通过一群人来获得资源,进行计算和决策,如何确保这些在地理位置上极其分散的人群以值得信任的方式互相协作?

将空间计算搬到室内、水下与地下:尽管在很大程度上,GPS信号在室内是不可用的,但人类在室内的时间多达80%到90%。基于位置的服务(比如路线导航)目前只占到了人们日常时间的10%到20%。但随着室内定位技术的发展寻路与导航功能(可用在大型机场与医院中),人们对21世纪的新期望是GPS在任何情况下可用,无论通过手机信号发射塔、WIFI发射器还是其他室内设备,从而使人们能够利用室内与地下定位(如矿山、隧道)。关于室内定位有一些新的研究问题,包括:哪种可扩展算法能够通过CAD图纸为室内空间创建导航地图?如果这个建筑没有CAD图纸呢?在GPS信号衰减甚至不可用时,我们如何进行可靠的室内定位服务?

长期研究需求

空间计算为社会提供了巨大的价值,不过在斩获成功的同时也带来了巨大的挑战。想要解决这些挑战,需要在空间计算领域乃至更多学科拥有专业知识与技能。首先,需要克服公众实际上担任地图绘制者这一现实的挑战,需要将数据来源从取自几个可信任的来源,变成让大批志愿者协同合作提供。其次,从给几个平台配备定位功能(比如手机)这种做法,改成几乎所有平台均配备(比如传感器、PC和云端等)定位功能。再次,需要更好地了解人类认知,以确保全社会都会从基于位置的服务中受益。最后,空间计算必须解决用户信任与隐私被曝光的隐患问题。

从融合到协同:一直以来,流行的GIS软件产品都是为几何数据(如点、线、多边形)和栅格数据(如卫星图像)所设计的。然而,现在有越来越多的地理数据是来自大众自愿提供的信息,包括签到、发推、地理标签、位置报告还有GPS追踪。自愿提供的地理位置信息对数据误差、可信度与偏差提出了挑战。在空间计算技术中,信息出错所带来的政治与法律后果可能代价高昂,比如2005年在特里娜飓风过后,美国国会对新奥尔良最容易发生洪涝的联邦地图延迟发布这一点十分关注,由于信息不确定而导致重建步伐被拖慢。将来,这类的政治或法律问题会更加严重。要想应对这种挑战,需要转换思想,从传统的数据融合转到更宽泛的数据协同模型,这种新的模型会引发更多问题。例如,志愿者经常用到地名(比如硅谷)和介词(比如附近、在、顺着),而非精确的位置坐标(比如经纬度)。因此我们需要给出解决办法,调整现有基于坐标的数据架构与算法,使其适用基于地名与空间介词的空间数据信息。此外,我们需要针对空间和时空的计算制定标准,通过质量改进过程(如同行评审等)和质量评定(如位置精度),更有效地利用用户所自愿贡献的地理信息。

从传感器到云:在20世纪,空间计算在公众心目中就是软件(比如ArcGIS和Oracle Spatial Databases)。如今,空间系统所有级别的计算堆栈都会受到新的影响:由于智能手机以及基于网络的虚拟地球仪得到了广泛使用,越来越多的平台都包含了定位功能。空间计算的底层计算堆栈需要新的基础设施支持,从而在不同的硬件、汇编语言、操作系统内核、运行库、网络堆栈、数据库管理系统、地理信息系统以及应用程序中,对空间数据类型与运算进行合理分配。为了改进增强现实功能,需要对现有的眼镜显示器和智能手机等设备作出调整,从而获得自动、准确、可扩展的检索方式、识别方式与信息展示方式。而紧急救援、健康管理、水能分布的实时状况监控则需要遍布全球的基础设施建设,为我们提供实时的以厘米为精度的定位信息。由空间大数据引发的计算问题为云计算研究提供了新的研究机遇:现有的空间数据集超出了普通空间计算技术能力,如何计算其规模、种类与更新率,并用合理的方式学习、管理、处理数据。

空间认知为先:以前,空间计算服务只提供给少数经过GIS训练的专业人员,他们所分享的专业术语难以为大众所理解。如今,民众在日常使用位置服务的同时,也为地图制作提供相关的信息,对于空间认知心理学的需求也变得迫切起来。理解这些内容可以方便大众更好地利用及设计地图等地理信息产品。需要推进对空间认知辅助的研究,探索新的想法,比如为不会看地图的用户提供个性化的地标导航服务,或者在无名道路上提供新地图导航服务。对群体行为的理解能够增强针对人群(相对于个体)的空间计算服务。在这些场景中,背景信息(比如发推的人、其位置还有这种情况下的物理特性)也应纳入考虑,来诠释紧急情况下在推特上的警报信息(比如台风等自然灾害)。应当对理解空间服务的新办法(比如导航、学习空间布局、阅读地图),还有不同群体(比如司机和行人)理解空间的方式进行进一步研究,来抓住这些机会:人们如何表示并学习认知地图?如何利用空间认知概念提高空间计算服务的可用性?如何设计出优秀的UI界面,缩小“微观”与“宏观”的差距——“微观的”空间计算,比如在室内带有立体显示的桌面系统与精确的3D追踪;“宏观的”空间计算,比如在户外通过手机或可穿戴设备上的粗略GNSS。

位置隐私:虽然位置信息(如手机和汽车GPS)为应急人员、消费者及行业提供了很大价值,但是这些数据流也带来了严重的隐私泄漏问题与诚信问题,并引出通过位置信息监控大众的信息滥用问题。比如欧盟就曾指责谷歌街景侵犯隐私,并在一些国家禁用该服务。位置信息使用与隐私保护的博弈仍是个很大的挑战。而模糊化位置信息的努力在很大程度上带来了负面效果。很多人因担心隐私泄漏而不敢使用相关的服务,计算机科学家需要与政策制定者一同,努力赢得公众的信任。必须按照“公平信息处理条例”来设计新的法规,特别是与通知、透明度、承诺、诚实与责任义务相关的那些。不过,这种调整也会引发新的问题,比如:怎么才算得到了收集空间数据的“充分通知”?应当如何请求授权?应当保存哪些信息,保存多久?更明白的说法是:什么时候定位信息会侵犯隐私权?降低地图分辨率是否能解决这个问题?我们如何在满足社会需求的同时(如追踪传染病),保护个人位置信息的隐私?

结论

在未来几十年中,空间计算为研究者及企业家等人提供了一系列重大的机遇。想要抓住这些机会,需要在该研究领域投入大量人才与资金,包括但不限于上面所述的案例。如今的很多空间计算项目太过局限,无法达到临界质变所需的进步。捐助者必须考虑将大量资金投在综合多所大学多个教职员团队的更大型更冒险的研究上。一些示范项目包括美国国家地理信息与分析中心、加拿大GEOmatics信息决策网络、荷兰的GRE项目以及澳洲空间信息合作研究中心。在研究领域的另一障碍在于,来自空间计算专家申请的补助金很少,可能会导致顶尖人才的缺乏。因此,资助机构应当特别考虑这类的补助申请。

一些机构在空间计算方面设立了研究项目,鉴于其跨领域的范围,捐助者应当在这一新兴领域创建专为空间计算设计的长期研究项目,以打造出计算机科学领导者。多机构间相互协调将会减少项目竞争,促进跨学科交融,而跨部门研究也会让整个领域包括机构自身受益。

最后,空间计算科学家需要研究者本学校提供更多制度上的支持。除了一次性的大型资助之外,一些研究型大学也建立了GIS中心还有校园范围内的空间项目,以进行跨学科的研究,包括气候变化与公共卫生等,更多研究型大学也应该跟上这一步伐。

空间计算已经证明了自身价值——为社会提供了重大的经济机遇,而在这方面的进一步深化必将带来更具革命性的进步。

0 人点赞