线性混合模型系列一:基本定义

2019-10-13 14:30:32 浏览数 (1)

这是之前写的学习笔记,混合线性模型内容很多,而我只是学习了开头,最基础的原理和推导,有很多不懂又对自己得过且过的地方,所谓学习进入了“瓶颈期”,改革进入了“深水区”,就是我现在的状态。

纪德说过一句话:“年轻时候,精力正好,敏感性也最高,干自己想干的事情,享受自己可以享受的东西”,我深有感触,现在是码字的最好时光,精力充沛,思路清晰,将自己的学习轨迹写在公众号上,皇天后土实所共鉴。

本次笔记,准备把混合线性模型系统的学习一遍,配合代码实现。混合线性模型,是育种数据分析中最常用到的模型,因为育种数据比较复杂,而且数据间不是独立的,有的是多年多点,有的是有系谱或者分组信息,混合线性模型可以处理非独立,非齐次的数据,应用广泛。

工作这么长时间,一直说是混合线性模型,一直用REML,但是知其然不知其所以然,总感觉知识不扎实,心里不踏实。

前一段时间,听完中农的统计遗传学summer school,感觉要把这一块短板给补齐,否则一直是个拦路虎。

我要立下决心,神来杀神,鬼来杀鬼,线性代数不会就学习线性代数,矩阵运算不通就学习矩阵运算,求导不懂就看求导。我不是数学专业,不是统计专业,但也是本科毕业,研究生毕业,也学习了高等数学和线性代数,人不能自己把自己吓到。

怎么样戒烟?

  1. 首先把戒烟这个事情公布于众
  2. 这样再吸烟时就要考虑这种信用成本

写学习笔记也是这样:

  1. 首先把计划列出来,公布于众
  2. 然后对自己是一种警示,也是一种激励
  3. 对一个东西懂不懂,看能不能输出,把东西写清楚,是倒逼学习的一种方法

“天下事有难易乎?为之,则难者亦易矣;不为,则易者亦难矣。人之为学有难易乎?学之,则难者亦易矣;不学,则易者亦难矣。”

1. 混合模型假定

解释

  • y为观测值向量
  • b为固定因子效应值向量(BLUE)
  • X为固定因子关系矩阵
  • u为随机因子效应值向量(BLUP)
  • Z为随机因子关系矩阵
  • e为残差向量

假定

  • E(u) = 0 # 即BLUP值的平均值为0
  • Var(u) = G # 即BLUP值的方差为G
  • E(e)= 0 # 残差平均值为0
  • Var(e) = R # 残差方差为R
  • Cov(u,e)= 0 # 残差和BLUP相互独立,协方差为0

可以写为:

上面的意思是u和e的平均值为0,方差为G和R,协方差为0

推断

2. 固定,随机和混合模型

2.1 固定模型

所有效应都是固定效应,对应的就是没有随机效应,称为固定模型

2.2 随机模型

所有效应都是随机效应,对应的就是没有固定效应,称为随机模型

2.3 混合模型

既有固定因子,又有随机因子,称为混合模型

3. 向量计算方差公式推导

如果a是向量,y = ax, 如果var(x) = V, 那么var(y) = var(ax) = aVar(x)a’ = aVa’, 下面是具体描述

var

0 人点赞