Pandas 处理丢失数据

2021-03-03 12:32:09 浏览数 (1)

代码语言:javascript复制
import pandas as pd
import numpy as np

dates =pd.date_range('20130101', periods = 6)
df = pd.DataFrame(np.arange(24).reshape((6, 4)), index = dates, columns = ['A', 'B', 'C', 'D'])
df.iloc[0, 1] = np.nan
df.iloc[1, 2] = np.nan

print(df)

# 删除有NaN值的数据
# axis=0 表示以行删除,axis=1表示以列删除
# how='any' 表示有任何NaN就执行删除操作,how='all' 表示删除所有制都为NaN的数据
print(df.dropna(axis = 0, how = 'any'))  # how = {'any', 'all'}
print(df.dropna(axis = 1, how = 'any'))

# 为NaN值填充value
print(df.fillna(value =0))

# 判断数据是否缺失,会返回所有数据位为True或False
print(df.isnull())

# 判断整个数据是否丢失数据,只要有一个位置丢失数据,就返回True,否则返回False
print(np.any(df.isnull()) == True)

0 人点赞