为了拓展python在地学的应用,一个比较流行的库geopandas,还是有必要接触的,但是接触的第一感觉就并不是太友好,对于其geometry的设定,初衷是不错的,可是体验效果有点糟糕,但是打开其中的字段,呈现的不是数据,而是矢量对象(如面图层),对我刚接触的人来说算是意外,但对于我更敏感的数据层面,我觉得按照pandas数组或者numpy数据的习惯而言,第一手应该还是数据,可能比较容易接受(个人偏见,慢慢深入之后应该会有改观)。另外geometry的数据量偏大的时候很容易造成打开速度变慢。
对于初次接触,首要面对的问题就是如何读取数据,如何创建数据,对我而言,我更关心怎么创建数据。所以用点图层为例,创建一个带坐标系的图层,应该就是入门第一步了。
当然不能免俗的,还是看看怎么载入数据:
代码语言:javascript复制
import pandas as pd
import geopandas
import matplotlib.pyplot as plt
import shapely
import numpy as np
world = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))
world.plot()
plt.show()
接下来,创建图层(附带坐标系):
代码语言:javascript复制import shapely
import numpy as np
df = pd.DataFrame(np.random.randn(50, 3),columns=['X', 'Y', 'Z'])
geom = [shapely.geometry.Point(xy) for xy in zip(df.X, df.Y)]
gdf = geopandas.GeoDataFrame(df, geometry=geom,crs= {'init': 'epsg:32633'})
#gdf.to_crs(epsg=4326)
最后,更改坐标系,在原数据基础上:
代码语言:javascript复制gdf.to_crs(epsg=4326)#修改为wgs84坐标系
完成,其中for循环,按照官方材料可以修改为pandas Dataframe操作,可以减少数据量太大时造成的处理时间延长。