一、数据生成与导入
代码语言:javascript复制import pandas as pd
# 利用Pandas里面的read系列可直接读取相应格式的数据文件。
df = pd.read_csv('./data.csv')
二、数据信息查看
代码语言:javascript复制# 查看整体信息
df.info()
#查看维度
df.shape
# 查看列名
df.columns
# 查看数据类型
df.dtypes
# 查看空值
df.isnull()
# 查看age唯一值
df['age'].unique()
# 查看数据表值
df.values
# 查看前5行数据
df.head(5)
# 查看最后5行数据
df.tail(5)
三、数据清洗和预处理
代码语言:javascript复制# 空值处理删除
df.dropna(how='any',inplace=True)
# 空值处理填充
df.fillna(0)
# 空格处理
df['name'] = df['name'].map(str.strip)
# 大小写转换
df.['name'].str.lower()
# 更改数据类型
df.['age'].astype('int')
# 更改列名称
df.rename(columns={'name':'名字','age':'年龄'})
# 删除重复值
df['cabin'].drop_duplicates(keep='last')
# 数据替换
df['name'].replace('C','c')
四、数据提取和筛选
代码语言:javascript复制# 按标签进行提取
df.loc[:2,'age']
# 按位置提取
df.iloc[:2,3]
# 按指定条件对数据进行提取
df['group'].isin(['high'])
# 筛选数据
df.loc[df['age'] > 25 ) | (df_inner['group'] == 'high')].head()
五、数据汇总与统计量计算
代码语言:javascript复制# 按字段分组
df.groupby(['columns'])
# 数据透视表
pd.pivot_table(data,values=None,index=None,columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,margins_name='All')
六、数据存储
代码语言:javascript复制# 存储到excel
df.to_excel('data.xlsx',sheet_name='a')
# 存储到csv
df.to_csv('data.csv')
如果觉得内容还不错,分享给更多朋友,一起提升编程技能。