Pandas-26.稀疏数据
- 所有的Pandas数据对象都有to_sparse()方法来转换成一个SparseIndex对象以节约内存。
df = pd.DataFrame(np.random.randn(10000, 4))
df.loc[:9998] = np.nan
sdf = df.to_sparse()
- 用`to_dense()方法来将稀疏对象转换为标准对象
- 稀疏数据对象具有与其密集标识相同的dtype。自持
float64
、int64
、和booldtypes
。 取决于dtype
、fill_value
默认值的修改:- float64 − np.nan
- int64 − 0
- bool − False