Pandas-26.稀疏数据

2019-05-29 20:40:32 浏览数 (1)

Pandas-26.稀疏数据

  • 所有的Pandas数据对象都有to_sparse()方法来转换成一个SparseIndex对象以节约内存。
代码语言:javascript复制
df = pd.DataFrame(np.random.randn(10000, 4))
df.loc[:9998] = np.nan
sdf = df.to_sparse()
  • 用`to_dense()方法来将稀疏对象转换为标准对象
  • 稀疏数据对象具有与其密集标识相同的dtype。自持float64int64、和booldtypes。 取决于dtypefill_value默认值的修改:
    • float64 − np.nan
    • int64 − 0
    • bool − False

0 人点赞