pandas的一些小知识

2020-04-01 16:21:46 浏览数 (1)

1.获得行名和列名

代码语言:javascript复制
data._stat_axis.values.tolist()  # 输出行名并转化为列表
data.columns.values.tolist() # 输出列名并转化为列表

2.获得行数和列数

代码语言:javascript复制
data.shape # 行数和列数
data.shape[0] # 行数
data.shape[1] # 列数

3.第一列作为行名

代码语言:javascript复制
data = pd.read_csv('1.csv', sep = ',', index_col=0)

4.数据框合并

代码语言:javascript复制
pd.merge(data1, data2, on='key') # 合并两个data,用key这一列合并,不提供则自动检索

5.数据排序

代码语言:javascript复制
data.sort_values(by='key') # 按照某一列排序,也可按照几列

6.计算汇总

代码语言:javascript复制
data.sum(axis=1) # 按行求和
data.mean(axis=1) # 按行求平均
data.sum(axis=0)  # 按列求和
data.describe() # 汇总统计 平均 分位数等

最后一行汇总会输出:

describe

7.数据缺失的处理

代码语言:javascript复制
data.dropna() # 如果有NA就删掉
data.dropna(how='all',axis=1)  # 当所有均为NA时才删掉,指定删掉的轴

8.构建和查询数据

代码语言:javascript复制
data = {'first':[1,2,3], 'second':[4,5,6]}
data = pf.DataFrame(data)

输出:

data

查询操作:

代码语言:javascript复制
data['first'] # 按名称取列
data[['first', 'second']] # 按名称取出两列
data.loc[0] # loc取第一行
data.iloc[:,0] # iloc取第一列
data.iloc[0, :] # iloc取第一行
data.iloc[[0,2],:] 取第一列和第三列

筛选操作:

代码语言:javascript复制
data[data['first']>=2]  # 输出第一列中数据大于等于2的数据

9.数据框重新索引

代码语言:javascript复制
data.reindex([2,3,4])

欢迎各位关注微信公众号生信编程日常~ 共同进步!

0 人点赞