Pandas 常见用法总结

2019-05-24 16:40:39 浏览数 (1)

一、数据生成与导入

代码语言:javascript复制
import pandas as pd

# 利用Pandas里面的read系列可直接读取相应格式的数据文件。
df = pd.read_csv('./data.csv')

二、数据信息查看

代码语言:javascript复制
# 查看整体信息
df.info()

#查看维度
df.shape

# 查看列名
df.columns

# 查看数据类型
df.dtypes

# 查看空值
df.isnull()

# 查看age唯一值
df['age'].unique()

# 查看数据表值
df.values

# 查看前5行数据
df.head(5)

# 查看最后5行数据
df.tail(5)

三、数据清洗和预处理

代码语言:javascript复制
# 空值处理删除
df.dropna(how='any',inplace=True)

# 空值处理填充
df.fillna(0)

# 空格处理
df['name'] = df['name'].map(str.strip)

# 大小写转换
df.['name'].str.lower()

# 更改数据类型
df.['age'].astype('int')

# 更改列名称
df.rename(columns={'name':'名字','age':'年龄'})

# 删除重复值
df['cabin'].drop_duplicates(keep='last')

# 数据替换
df['name'].replace('C','c')

四、数据提取和筛选

代码语言:javascript复制
# 按标签进行提取
df.loc[:2,'age']

# 按位置提取
df.iloc[:2,3]

# 按指定条件对数据进行提取
df['group'].isin(['high'])

# 筛选数据
df.loc[df['age'] > 25 ) | (df_inner['group'] == 'high')].head()

五、数据汇总与统计量计算

代码语言:javascript复制
# 按字段分组
df.groupby(['columns'])

# 数据透视表
pd.pivot_table(data,values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All')

六、数据存储

代码语言:javascript复制
# 存储到excel
df.to_excel('data.xlsx',sheet_name='a')
# 存储到csv
df.to_csv('data.csv')

如果觉得内容还不错,分享给更多朋友,一起提升编程技能。

0 人点赞