初试geopandas

2020-09-15 15:02:52 浏览数 (1)

为了拓展python在地学的应用,一个比较流行的库geopandas,还是有必要接触的,但是接触的第一感觉就并不是太友好,对于其geometry的设定,初衷是不错的,可是体验效果有点糟糕,但是打开其中的字段,呈现的不是数据,而是矢量对象(如面图层),对我刚接触的人来说算是意外,但对于我更敏感的数据层面,我觉得按照pandas数组或者numpy数据的习惯而言,第一手应该还是数据,可能比较容易接受(个人偏见,慢慢深入之后应该会有改观)。另外geometry的数据量偏大的时候很容易造成打开速度变慢。

对于初次接触,首要面对的问题就是如何读取数据,如何创建数据,对我而言,我更关心怎么创建数据。所以用点图层为例,创建一个带坐标系的图层,应该就是入门第一步了。

当然不能免俗的,还是看看怎么载入数据:

代码语言:javascript复制

import pandas as pd
import geopandas
import matplotlib.pyplot as plt
import shapely
import numpy as np

world = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))
world.plot()
plt.show()

接下来,创建图层(附带坐标系):

代码语言:javascript复制
import shapely
import numpy as np
df = pd.DataFrame(np.random.randn(50, 3),columns=['X', 'Y', 'Z'])
geom = [shapely.geometry.Point(xy) for xy in zip(df.X, df.Y)]
gdf = geopandas.GeoDataFrame(df, geometry=geom,crs= {'init': 'epsg:32633'})


#gdf.to_crs(epsg=4326)

最后,更改坐标系,在原数据基础上:

代码语言:javascript复制
gdf.to_crs(epsg=4326)#修改为wgs84坐标系

完成,其中for循环,按照官方材料可以修改为pandas Dataframe操作,可以减少数据量太大时造成的处理时间延长。

0 人点赞