这是之前写的学习笔记,混合线性模型内容很多,而我只是学习了开头,最基础的原理和推导,有很多不懂又对自己得过且过的地方,所谓学习进入了“瓶颈期”,改革进入了“深水区”,就是我现在的状态。
纪德说过一句话:“年轻时候,精力正好,敏感性也最高,干自己想干的事情,享受自己可以享受的东西”,我深有感触,现在是码字的最好时光,精力充沛,思路清晰,将自己的学习轨迹写在公众号上,皇天后土实所共鉴。
本次笔记,准备把混合线性模型系统的学习一遍,配合代码实现。混合线性模型,是育种数据分析中最常用到的模型,因为育种数据比较复杂,而且数据间不是独立的,有的是多年多点,有的是有系谱或者分组信息,混合线性模型可以处理非独立,非齐次的数据,应用广泛。
工作这么长时间,一直说是混合线性模型,一直用REML,但是知其然不知其所以然,总感觉知识不扎实,心里不踏实。
前一段时间,听完中农的统计遗传学summer school,感觉要把这一块短板给补齐,否则一直是个拦路虎。
我要立下决心,神来杀神,鬼来杀鬼,线性代数不会就学习线性代数,矩阵运算不通就学习矩阵运算,求导不懂就看求导。我不是数学专业,不是统计专业,但也是本科毕业,研究生毕业,也学习了高等数学和线性代数,人不能自己把自己吓到。
怎么样戒烟?
- 首先把戒烟这个事情公布于众
- 这样再吸烟时就要考虑这种信用成本
写学习笔记也是这样:
- 首先把计划列出来,公布于众
- 然后对自己是一种警示,也是一种激励
- 对一个东西懂不懂,看能不能输出,把东西写清楚,是倒逼学习的一种方法
“天下事有难易乎?为之,则难者亦易矣;不为,则易者亦难矣。人之为学有难易乎?学之,则难者亦易矣;不学,则易者亦难矣。”
1. 混合模型假定
解释
- y为观测值向量
- b为固定因子效应值向量(BLUE)
- X为固定因子关系矩阵
- u为随机因子效应值向量(BLUP)
- Z为随机因子关系矩阵
- e为残差向量
假定
- E(u) = 0 # 即BLUP值的平均值为0
- Var(u) = G # 即BLUP值的方差为G
- E(e)= 0 # 残差平均值为0
- Var(e) = R # 残差方差为R
- Cov(u,e)= 0 # 残差和BLUP相互独立,协方差为0
可以写为:
上面的意思是u和e的平均值为0,方差为G和R,协方差为0
推断
2. 固定,随机和混合模型
2.1 固定模型
所有效应都是固定效应,对应的就是没有随机效应,称为固定模型
2.2 随机模型
所有效应都是随机效应,对应的就是没有固定效应,称为随机模型
2.3 混合模型
既有固定因子,又有随机因子,称为混合模型
3. 向量计算方差公式推导
如果a是向量,y = ax, 如果var(x) = V, 那么var(y) = var(ax) = aVar(x)a’ = aVa’, 下面是具体描述