DataFrame是pandas库中另一个重要的数据结构,它提供了类似于excel的二维数据结构
使用pandas.DataFrame()函数可以创建一个DataFrame数据类型
【用数组创建DataFrame】
import pandas as pd
import numpy as np
a=np.random.uniform(0,150,size=(5,3)).astype('int32')
df=pd.DataFrame(a)
df
我们首先使用random.uniform生成了一个5*3的矩阵a,它的每个元素是0~150的随机数
然后用DataFrame()函数把矩阵a转换为DataFrame类型
可以看到,在jupyter中,dataframe的显示非常直观,
上面第一行是它的列索引(默认为0,1,2)
左边第一列是它的行索引(默认为0,1,2,3,4)
中间的区域是我们的数据
DataFrame跟series类似,可以使用index参数手动设置行索引
此外,还可以使用columns参数设置列索引
import pandas as pd
import numpy as np
a=np.random.uniform(0,150,size=(5,3)).astype('int32')
line=['ZhangSan','LiSi','WangWu','ZhaoLiu','SunQi']
columns=['Literature','Math','English']
df=pd.DataFrame(a,index=line,columns=columns)
df
【用字典创建DataFrame】
pandas还支持字典创建DataFrame
字典的键(key)将作为列索引,值(value)将作为一个个数据
import pandas as pd
import numpy as np
a= np.random.randint(0,150,size=5)
b= np.random.randint(0,150,size=5)
c= np.random.randint(0,150,size=5)
data={'Literature':a,'Math':b,'English':c}
df=pd.DataFrame(data)
df