1. 概念区分
1.1 测定日模型(Test-day-model)与随机回归模型(Random-regression-model)的区别
- 测定日模型主要是分析奶牛在不同测定日产奶性状的模型
- 随机回归模型, 主要是分析一个个体有多个观测值的数据, 即纵向数据(longitudinal data)或者称为面板数据(panel data)
- 测定日模型是随机模型的一种类型
1.2 动物育种中, 有哪些数据可以用随机回归模型进行分析
- 不同时间点测量的个体的体重, 体长等
- 不同时间点测量的产奶量, 饲料消耗, 脂肪成分变化, 产蛋量等
- 不同胎次的产仔数等
2. 纵向数据的分析方法
2.1 纵向数据模型特点
考虑个体的不同观测值间的联系, 而且每个个体由于个体的特异性, 关系不同. 这些模型将不同个体的差异作为随机因子加入回归模型中, 以反映个体对其重复测量的影响.
2.2 纵向数据分析常用模型
- 随机效应模型
- 方差分量模型
- 多层模型
- 多水平模型
- 两步模型
- 随机效应混合模型
- 随机回归模型
- 分层线性模型
3. 随机回归模型的优势
3.1 随机回归模型与重复力模型的区别
- 动物育种中, 像产蛋量, 羊毛性状, 猪的产仔数等由于有重复测量的数据, 可以计算重复力.
- 表型 = 均值 加性效应 重复力效应 残差
- 之所以能剖分出重复力效应, 主要原因是其有重复观测数据, 就像二因素方差分析中, 只有交互不同水平有重复观测值, 才能分析交互作用的显著性.
3.2 随机回归模型与多性状模型区别
- 多性状模型, 主要是性状间不独立, 这时可以使用多性状模型, 估算性状间的方差协方差组分, 计算遗传相关, 用于育种中的间接选择. 比如猪50天, 100天, 150天的体重, 三者之间是有关联性的, 运用多性状模型, 可以估算出三个性状间的遗传相关, 达到提前选择的目的.
- 当性状比较多时, 比如10性状, 需要估算45个参数. 像奶牛不同测定日(5~305天)的性状, 高达上百个, 需要估算更多的参数, 无法实现, 因此不能使用多性状模型进行分析.
3.3 测定日回归模型的分析优势
- 1, 可以分析多个性状的情况, 比如100天, 300天产奶量
- 2, 利用Legendre多项式, 不同阶数的比较, 选择最优模型, 结果可以转化为常规多性状模型的形式, 包括各性状遗传相关和表型相关, 各性状遗传力, 重复力等
- 3, 相对于多性状模型, 模型更容易收敛, 结果也更准确
3.4 随机回归模型到动物模型的复杂度
4. 测定日模型的分析思路
4.1 测定日回归模型的操作方法1: 书写模型
4.2 测定日回归模型的操作方法2: 参数估算
4.3 测定日回归模型的操作方法3: 结果展示
5. 文献解析: 使用测定日模型评估荷斯坦奶牛的遗传参数
5.1 文献题目
5.2 数据
数据的基本信息 数据根据测定日DIM分成10个月,主要用于残差异质性定义。