统计学与pandas学习(二)——平均值

2019-08-20 11:19:54 浏览数 (1)

第二章《平均值的作用和把握方法》。

统计量是概括数据的数值

所谓统计量,是“用一个数字来概括数据的特征”。具体说就是“平均值”、“方差”和“标准方差”。

平均值

“用数据的合计除以数据数“得到的东西。

频数分布表上的平均值

以女大学生身高为例:

A 组值

B 相对频数

AxB

143

0.0125

1.7875

148

0.075

11.1

153

0.2375

36.3375

158

0.375

59.25

163

0.225

36.675

168

0.075

12.6

AxB的合计=(平均值)

157.75

组数x相对频数的合计=平均值。因为频数分布舍弃了原始数据的一部分信息,所以此平均值与原始数据取得的平均值有差别。

平均值的性质

  • 数据分布在平均值周边。
  • 多次出现的数据对平均值有大的影响。
  • 在直方图呈左右对称的情况下,平均值在对称轴的位置上。

练习

根据虚构的数据,填好频数分布图,计算平均值。

组值

频数

相对频数

组值x相对频数

30

5

0.05

1.5

50

10

0.1

5

70

15

0.15

10.5

90

40

0.4

36

110

20

0.2

22

130

10

0.1

13

合计100

合计(平均值)88

计算平均值的4种方法

  1. 算数平均数:数值相加除以数值个数
  2. 几何平均数:数值相乘,对乘积开平方
  3. 均方根值:数值相加,和除以2,对结果开平方
  4. 调和平均数:1分别除以数值然后相加,2除以相加的和

0 人点赞