提到方差,大家都不陌生在R语言实现很简单,一个命令var()。但是提到方差的应用,你是否了解?
方差定义用来度量随机变量和其数学期望(即均值)之间的偏离程度。真正在应用时,当然不是这么解释。比如,影响一个药物的效果有很多因素,那么我们寻找这些因素中的主要因素,最简单的方法那就是方差。通过查看所有因素的方差大小,便可对所有的因素做一个排序。方差越大代表,一个因素在所有样本中的波动比较大,那么用来作为区分因素也就顺理成章。
R语言中的使用:
提到方差,我们还有一个概念需要知道,那就是协方差。协方差定义用于衡量两个变量的总体误差,即描述两个变量之间的相对于各自的期望值的变化趋势。方差是协方差的一种特殊情况,即两个变量是同一个变量的情况。
R语言中的使用:
那么,协方差和相关系数又存在很大的区别。相关系数定义研究变量之间线性相关程度的量,即主要反映两个变量之间的线性关系,正相关或者负相关,通过相关系数R反映 (R值得范围-1~1)。所谓正相关,即R>0,即两变量同向变化,R越接近1,相关性越强;反之,则为负相关。当然R=0时,也就没啥关系啦。相关系数同时又分为两种求法皮尔森和斯皮尔曼。皮尔森主要是反映同类变量的相关性;斯皮尔曼则可通过秩和方式对不同类型的变量求相关系数。
R语言中使用:
以上函数为组成主成分分析的核心函数。