基本概念
mean 平均值
一组数字相加除以数字个数 ,
expected values 期望值
常用字母u表示,统计学里常用mean表示u
median 中值
将数字从小到大排列 位于队列最中间的那个值,如果是偶数则取最中间的两个数的平均值。
mode 众值
一组数字中出现频次最高的那个数字,如果出现频次最高的数字有多个,则为多众值。
weighted mean 加权平均值
给一组数中每个数规定一个权重,将每个数字和自己的权重相乘在相加起来除以总权重的到的值
例如 最终考试成绩的算法,给力如下权重
那么这个学生的最终成绩为 (88X25 71X30 97X10 90X35)/100=84.5
quartiles 四分位数
四分位数有三个点,Q1,Q2,Q3 。我们将一组数字从小到大排列,从最小数的到中位数之间的一段数字中再取中位数叫Q1,中位数就是Q2,从中位数到最大的数中间这段的中位数叫Q3. 计算Q1和Q3时我们将排序的数列一分为二,如果这组数列个数是奇数,则计算时不含中间这个中值(Q2),如果这组数列是偶数,则刚好平分 分别计算Q1和Q3
interquartile rang 四分位距(IQR)
就是Q3-Q1的值 。
variance 方差
常用 σ的平方表示,是指一组数 中每个数字与mean的差的平方之和 除以这组数的个数
standard deviation 标准差/均方差
常用σ表示,是方差的平方根
概率
Event 事件
Sample Space 样本空间
随机实验的一切可能结果的全体称为样本空间
Probability 概率
事件A发生的概率:
样本空间S的概率为1
A发生和不发生的概率相加=1
事件A和事件B ,A U B 表示A和B任何一个发生, A n B 表示A和B同时发生
对于独立的事件A和B ,P(A n B)=P(A)* P(B) , P(A u B)=P(A) P(B)-P(AnB)=P(A) P(B)-P(A)*P(B)
Compound Events 复合事件
复合事件就是两个或多个事件的组合
Mutually Exclusive Events 两两互斥事件
如果 A n B =空 ,则A和B为互斥事件 P(A n B)= 0 ,则 P(A U B)=P(A) P(B)
Collectively Exhaustive Events 所有互斥事件
就是所有事件都互斥
如果A和B是互不影响的独立事件 那么 出现A也出现B的概率就是 P (A n B) =P(A) X P(B) (这里A和B的出现按照顺序)
conditional probability 条件概率
条件概率是指事件B在另外一个事件A已经发生条件下的发生概率。条件概率表示为:P(B|A),读作“在A条件下B的概率”。如果A,B事件为互相独立的事件 那么 P(B|A)=P(B)。 如果A和B事件相交那么 P(AnB)=P(B|A)* P(A) ,因此