试验设计
试验设计时农业中比较核心的技能, 关系着试验数据的好坏, 关系着后续分析的模型, 关系着效率的高低.
兵马未动, 粮草先行. 好的试验设计, 事半功倍.
一个简单的试验: RCBD
小师妹来信:
师兄你好, 老板让我设计试验, 目前有5个品种, 我想重复3次, 如何设计试验?
师兄回信:
小师妹好, 这个问题难不倒我, 你可以把问题理解为单因素完全随机试验, 这里3次重复就是单纯的重复. 你也可以将问题理解为单因素随机区组试验, 这里的重复就是区组(block), 两者都可以. 如果田地间肥力均匀, 那就可以用完全随机设计, 这样试验的残差自由度更高, 如果肥力有梯度, 就需要用完全随机区组了.
小师妹来信:
师兄你好, 感觉重复和区组这两个单词很高深的样子, 我把品种名发给你, 你给我设计试验后发给我好了.
品种: 郑单958, 先玉335, 登海605, 豫玉22, 浚单20. 重复: 3次 试验方案: 完全随机区组
代码
代码语言:javascript复制library(agricolae)
cul = c( "郑单958", "先玉335", "登海605", "豫玉22", "浚单20")
rep = 3
exp = design.rcbd(cul,rep)
exp$book
exp$sketch
write.csv(exp$book,"d:/book.csv")
结果 保存在D盘, 名为book.csv
拉丁方
小师妹:
代码语言:javascript复制师兄, 我发现我有5个品种, 如果我重复5次的话, 是不是拉丁方更好一点呢? 那这样我不仅仅行是区组, 列也是区组, 就像数独一样, 试验精度应该会更高吧? 把试验代码发给我吧…
exp = design.lsd(cul)
exp$book
exp$sketch
write.csv(exp$book,"d:/book.csv")
田间种植图 每一行是一个重复, 每一列是一个重复, 真的是数独啊…
Latin和Lattice什么区别啊
师妹来信:
师兄, 这个拉丁方和格子方什么区别啊, 貌似很高端的样子, 我傻傻分不清楚啊.
师兄回信:
师妹, 这个问题的主要区别在于, 两者的拼写是不一样的, 拉丁方的拼写是Latin, 格子方的拼写是Lattice. 如果说试验设计的区别, 主要是拉丁方是正方形的, 重复数和品种数需要一样, 比如5个品种, 需要5次重复才可以用拉丁方设计, 如果品种较多时, 是不现实的, 因为它占用大量的资源, 比如100个品种, 就需要100个重复, 这种实验只适合品种较少的情况, 一般是10个以下. 格子方也是正方形的, 它是一种不完全区组的试验, 一个格子是一个重复, 品种数需要时某个数的平方, 比如25个品红, 可以组成5*5的格子.
师妹来信:
这么说来, 两者都比较死板, 现实应用有限吧?
师兄回信:
现在一般应用的是格子方的改良版: alpha-lattice, 它不局限与n*n, 可以是n*m, 那这样就大大扩大了它的应用范围.比如100个品种, 我可以是10*10, 也可以是20*5.
alpha-lattice怎么设计
师妹来信:
师兄, 比如我有120个品种, 我想安装10*12的形式设计alpha-lattice, 即每个block是10个品种, 每个重复有12个区组, 重复3次, 你把设计好的方案发过来吧.
代码:
代码语言:javascript复制cul = paste0("cul",1:100)
exp = design.alpha(1:120,10,3)
exp$sketch
write.csv(exp$book,"d:/book.csv")
田间种植图: 这里面rep1是第一个重复 每一样为每个区组, 共有10个品种(列) 每个重复有12个区组(行)
代码语言:javascript复制$`rep1`
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] "48" "12" "82" "63" "56" "54" "2" "50" "53" "68"
[2,] "86" "100" "43" "4" "61" "70" "89" "57" "91" "81"
[3,] "52" "90" "26" "42" "46" "67" "71" "66" "79" "5"
[4,] "98" "107" "51" "45" "72" "75" "18" "65" "73" "49"
[5,] "41" "104" "27" "19" "11" "34" "44" "85" "69" "92"
[6,] "24" "38" "118" "30" "83" "113" "8" "95" "33" "119"
[7,] "80" "58" "55" "17" "25" "106" "16" "9" "60" "37"
[8,] "101" "3" "78" "120" "84" "35" "1" "88" "99" "96"
[9,] "13" "6" "21" "108" "22" "117" "105" "32" "111" "102"
[10,] "31" "28" "62" "87" "36" "64" "93" "39" "97" "23"
[11,] "59" "112" "47" "115" "76" "29" "114" "15" "103" "94"
[12,] "74" "109" "10" "7" "77" "40" "20" "110" "116" "14"
$rep2
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] "65" "8" "15" "22" "42" "25" "99" "50" "110" "39"
[2,] "3" "52" "86" "54" "60" "119" "93" "117" "20" "49"
[3,] "56" "44" "98" "83" "90" "70" "74" "87" "114" "111"
[4,] "82" "96" "51" "38" "46" "106" "112" "62" "11" "105"
[5,] "33" "5" "12" "1" "29" "104" "100" "7" "102" "107"
[6,] "31" "75" "118" "26" "53" "84" "69" "94" "16" "4"
[7,] "43" "79" "35" "109" "68" "32" "76" "37" "85" "30"
[8,] "21" "73" "47" "88" "36" "61" "2" "55" "41" "14"
[9,] "71" "24" "40" "58" "45" "78" "103" "64" "57" "27"
[10,] "6" "89" "77" "23" "19" "48" "17" "113" "72" "59"
[11,] "67" "10" "92" "63" "28" "9" "120" "18" "81" "13"
[12,] "95" "97" "80" "66" "115" "116" "101" "91" "108" "34"
$rep3
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] "17" "90" "18" "34" "57" "36" "33" "76" "54" "22"
[2,] "59" "109" "44" "108" "99" "31" "52" "100" "106" "45"
[3,] "3" "19" "75" "47" "7" "62" "25" "70" "67" "32"
[4,] "107" "37" "112" "81" "101" "14" "71" "6" "56" "118"
[5,] "38" "10" "26" "80" "15" "86" "21" "98" "78" "48"
[6,] "92" "96" "12" "16" "119" "77" "64" "61" "42" "111"
[7,] "49" "50" "30" "55" "27" "28" "115" "105" "5" "4"
[8,] "43" "9" "113" "116" "65" "82" "88" "104" "93" "114"
[9,] "23" "110" "63" "117" "11" "35" "73" "24" "94" "66"
[10,] "13" "2" "72" "79" "69" "20" "95" "103" "1" "87"
[11,] "68" "97" "74" "89" "84" "58" "41" "8" "102" "46"
[12,] "85" "40" "60" "53" "83" "91" "29" "51" "39" "120"
alpha-lattice VS RCBD
1、 什么是完全随机区组试验? 根据局部控制的原则,将试验地按肥力水平划分为与处理重复次数相同的若干个区组,在区组内各处理小区完全随机排列的田间试验,区组内肥力相似,区组间肥力不同。这种试验符合田间试验设计的基本原则:重复、随机、局部控制,应用广泛。目前国内大部分的种子公司高级试验一般采用完全随机区组设计,目前国家预试和区试都是采用这种方法。
2、 什么是alpha-格子试验设计? alpha-格子试验设计是不完全区组的一种,每个区组只包含一部分品种,这些区组内的品种是一个重复的子集,即一套区组构成一个重复。这种试验设计主要是国外育种企业采用的一种不完全区组试验设计,主要应用于育种早期、中期产量试验阶段的品种筛选。国内育种企业正在接受和普及这种方法。
3、两者比较,完全随机区组的区组数不能大于10个品种,否则区组内均一性受到影响,区组设置失效。另外对于处理因素(品种)较多的试验,完全随机区组不适合,而alpha-格子试验设计,其区组内的品种可以控制较小的个数,因此总处理个数不受限制,完全随机区组适合处理数小于10个的试验,处理较多时用alpha-格子试验设计更好。
增广试验设计
师妹来信:
代码语言:javascript复制师兄, 我现在有200个品种, 我目前想用间比法, 但是上网发现增广试验设计(augmented design)更好, 我的对照有2个, 把试验结果和田间种植图发给我.
# augmented design
cul = paste0("cul",1:200)
ck = paste0("ck",1:2)
exp = design.dau(ck,cul,20)
exp$parameters
exp$book
write.csv(exp$book,"d:/book.csv")
结果 200个品种, 每10个插入两个对照, 共分为20组.
和传统间比法不一样的是, 对照是随机的, 品种也是随机的.
优势在于分析时更精确.
还有没有更好的试验设计?
师妹来信:
师兄, 你说还有没有更好的试验设计?
师兄回信:
这个问题不太好回答, 最开始, 我也认为随机区组, 完全随机, 拉丁方, 格子方, alpha-格子试验, 增广试验肯定是有好坏的. 现在看来, 每个试验都有自己的应用范围, 试验设计的目的在于控制误差, 使得试验的不同品种反映出其真实的水平来. 当然, 随着统计的发展, 一些新的统计方法不断出现, 以前不能够分析的, 现在可以分析了. 比如不平衡的试验, 或者平衡不完全的试验, 可以借助混合线性模型进行分析, 这也是alpha-lattice或者增广试验推广的主要原因. 好的现代的试验设计, 好过旧的过时的试验设计. 比如你用的是拉丁方, 试验不理想, 你可以用随机区组进行分析, 如果你设计的是完全随机, 那你是不能使用随机区组或者拉丁方进行分析的. 降维度是可以的, 升维度却很难, 这也是告诉我们设计试验时要多多考虑的原因啊.
agricolae包中有但是没有介绍的试验设计
- Graeco-Latin design 拉丁方的一种, 是二因素的处理.
- Youden design
- Balance Incomplete Block Design
- Cyclic design
- Split-plot design
- Strip-plot design