pandas_VS_Excel统计各班成绩的最大最小平均分合格优秀尖子人数
如图
[要求]
1.先分组再显示describe()情况
2.只统计“语文”“数学”“英语”三科各班的成绩最高分,最低分,平均分,
2.以上面的基础上设计自定义函数,增加统计:大于60分个数,大于80分个数,大于100分个数
【代码】
代码语言:javascript复制# -*- coding: utf-8 -*-
import pandas as pd
df=pd.read_excel('数据源(5个班各6人).xlsx',sheet_name='Sheet2')
'''
#df_groupby_describe=df[['语文','数学','英语']].groupby(df['班别']).describe()
#df_groupby_describe.to_excel('数据源(5个班各6人)_describe.xlsx')
'''
def d80(arr):
return sum(arr>80)
#grouped.agg(peak_to_peak)
def d60(arr):
return sum(arr>60)
def d100(arr):
return sum(arr>100)
df_groupby_describe=df.groupby(df['班别'])[['语文','数学','英语']].describe()
print(df_groupby_describe)
df_gr=df.groupby(df['班别'])[['语文','数学','英语']].agg({'max','min',d60,d80,d100}).round(2)
print(df_gr)
grouped=df.groupby('班别')
#print(grouped.describe())
#print(grouped.apply(lambda x: x[['语文','数学','英语']].describe()))
print(grouped.apply(lambda x: x[['语文','数学','英语']].describe().round(2)))
print(grouped.apply(lambda x: x.agg(['min', 'mean','max'])).round(2))
print(grouped.apply(lambda x: x[['语文','数学','英语']].agg(['min', 'mean','max'])).round(2))
print(grouped.apply(lambda x: x[['语文','数学','英语']].agg({'max','min',d60,d80,d100})).round(2))
【效果】
1.先再显示describe()
2.利用apply显示分组的情况,小数位数两位 方便观察
3.设定了自定义函数d60,d80,d100,再显示出来
=====今天学习到些====