1.获得行名和列名
代码语言:javascript复制data._stat_axis.values.tolist() # 输出行名并转化为列表
data.columns.values.tolist() # 输出列名并转化为列表
2.获得行数和列数
代码语言:javascript复制data.shape # 行数和列数
data.shape[0] # 行数
data.shape[1] # 列数
3.第一列作为行名
代码语言:javascript复制data = pd.read_csv('1.csv', sep = ',', index_col=0)
4.数据框合并
代码语言:javascript复制pd.merge(data1, data2, on='key') # 合并两个data,用key这一列合并,不提供则自动检索
5.数据排序
代码语言:javascript复制data.sort_values(by='key') # 按照某一列排序,也可按照几列
6.计算汇总
代码语言:javascript复制data.sum(axis=1) # 按行求和
data.mean(axis=1) # 按行求平均
data.sum(axis=0) # 按列求和
data.describe() # 汇总统计 平均 分位数等
最后一行汇总会输出:
describe
7.数据缺失的处理
代码语言:javascript复制data.dropna() # 如果有NA就删掉
data.dropna(how='all',axis=1) # 当所有均为NA时才删掉,指定删掉的轴
8.构建和查询数据
代码语言:javascript复制data = {'first':[1,2,3], 'second':[4,5,6]}
data = pf.DataFrame(data)
输出:
data
查询操作:
代码语言:javascript复制data['first'] # 按名称取列
data[['first', 'second']] # 按名称取出两列
data.loc[0] # loc取第一行
data.iloc[:,0] # iloc取第一列
data.iloc[0, :] # iloc取第一行
data.iloc[[0,2],:] 取第一列和第三列
筛选操作:
代码语言:javascript复制data[data['first']>=2] # 输出第一列中数据大于等于2的数据
9.数据框重新索引
代码语言:javascript复制data.reindex([2,3,4])
欢迎各位关注微信公众号生信编程日常~ 共同进步!