公式:
测试数据:
编号 | 英语 | 数学 |
---|---|---|
1 | 76 | 100 |
2 | 35 | 99 |
3 | 87 | 45 |
4 | 53 | 75 |
5 | 92 | 68 |
6 | 24 | 49 |
7 | 50 | 62 |
8 | 63 | 62 |
9 | 76 | 58 |
10 | 79 | 78 |
11 | 17 | 48 |
12 | 100 | 63 |
13 | 94 | 74 |
14 | 72 | 76 |
15 | 20 | 67 |
16 | 93 | 48 |
17 | 72 | 47 |
18 | 95 | 62 |
MEDIAN
返回给定数值集合的中值。中值是在一组数据中居于中间的数值。
语法 MEDIAN(number1,number2,...) Number1, number2, ... 要计算中值的 1 到 30 个数值。
说明
■ 参数应为数字,或者是包含数字的名称、数组或引用。
■ 若数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。
■ 若参数集合中包含偶数个数字,则 MEDIAN 将返回位于中间的两个数的平均值。请参阅示例中的第二个公式。
■注意:MEDIAN 函数用于计算趋中性,趋中性是统计分布中一组数中间的位置。
三种最常见的趋中性计算方法是:
■ 平均值 平均值是算术平均数,由一组数相加然后除以这些数的个数计算得出。
例如,1、2、2、4、6 和 9 的平均数是 24 除以 6,结果是 4。
■ 中值 中值是一组数中间位置的数;即一半数的值比中值大,另一半数的值比中值小。
例如,1、2、2、4、6 和 9 的中值是 3。
■ 众数 众数是一组数中最常出现的数。例如,1、2、2、4、6 和 9 的众数是 2。
实例
编号 | 英语 | 数学 |
---|---|---|
1 | 76 | 100 |
2 | 35 | 99 |
3 | 87 | 45 |
4 | 53 | 75 |
5 | 92 | 68 |
6 | 24 | 49 |
7 | 50 | 62 |
8 | 63 | 62 |
9 | 76 | 58 |
10 | 79 | 78 |
11 | 17 | 48 |
12 | 100 | 63 |
13 | 94 | 74 |
14 | 72 | 76 |
15 | 20 | 67 |
16 | 93 | 48 |
17 | 72 | 47 |
18 | 95 | 62 |
中位数 | 74 | 62.5 |
公式 | =MEDIAN(B2:B19) | =MEDIAN(C2:C19) |
中位数表示作用
中位数主要是为了更突出数据分布中的中间水平或典型值。
它相比平均数,能更好地应对极端值的影响。例如,在一组数据:1,2,3,1000 中,平均数约为 251.5,而中位数是 2.5。平均数受到 1000 这个极大值的强烈影响,不能很好地反映这组数据的“典型”大小。但中位数 2.5 则更能代表数据的中间水平。
在收入分配的研究中,中位数常常被用于更准确地反映大多数人的收入状况。假设一个地区的收入数据为:10000,20000,25000,30000,100000。平均数约为 37000,但中位数为 25000。在这里,中位数能更真实地展现大多数人实际的收入水平,排除了极少数高收入者对整体数据的过度影响。
在房价的统计中,中位数也能更有效地反映市场上多数房屋的价格水平,避免被少数高价豪宅拉高平均数,从而给购房者和政策制定者提供更有实际参考价值的信息。
中位数在什么情况下不能有效地代表数据的中间水平?
当数据分布严重偏态,且存在大量重复值集中在某一侧时。例如,数据为 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 100 ,虽然中位数是 2 ,但实际上大部分数据集中在 2 这一侧,不能很好地反映数据的整体分布情况。
当数据的样本量过小的时候。比如只有 3 个数据 10 ,20 ,30 ,中位数 20 可能并不能充分体现数据的特征,因为样本太少,代表性不足。
在分组数据中,如果分组不合理或者组距过大,可能导致中位数的计算不够精确,从而不能有效地代表数据的中间水平。例如,对年龄进行分组,组距为 10 岁,如果大部分人的年龄集中在某个组内的小范围内,而分组较粗,计算出的中位数可能无法准确反映真实的中间水平。
另外,如果数据的分布具有多个峰值或者非常不规则,中位数可能也无法很好地代表数据的中间水平。比如一组数据 1, 2, 2, 2, 3, 3, 3, 4, 4, 4 ,存在多个峰值,中位数 3 就不能很好地体现这种复杂的分布。
中位数的价值还是很高的,希望大家注意使用