数学建模之方差分析
- 方差分析(Analysis of Variance, ANOVA)
-
- 应用场景
- 单因素方差分析
-
- Matlab实现——anova1
-
- 多重比较
- 双因素方差分析
-
- Matlab实现——anova2
- 多因素方差分析
- 参考文献
方差分析(Analysis of Variance, ANOVA)
——用数理统计分析试验结果,鉴别各因素对结果影响程度的方法。
人们关心的试验结果称为指标,试验中需要考察、可以控制的条件称为因素或因子,因素所处的状态称为水平
应用场景
为了使生产过程稳定,达到优质、高产,需要对影响产品质量的因素进行分析,找出有显著影响的那些因素,除了从机理方面进行研究外,常常要做许多试验,对结果作分析、比较,寻求规律。
例如,从用几种不同工艺制成的灯泡中,各抽取了若干测量其寿命,要推断这几种工艺制成的灯泡寿命是否有显著差异;(判断不同工艺对灯泡寿命的影响程度)[单因素方差分析]
再如,用几种化肥和几个小麦品种在若干试验田里种植小麦,要推断不同的化肥和品种对产量有无显著差异[双因素方差分析]
单因素方差分析
只考虑一个因素A,A取几个水平,在每个水平上做若干试验,试验过程中,除A外的其他影响指标的因素都保持不变(只有随机因素存在)
将问题转换为假设检验——利用F-分布做显著性水平检验。
方差分析一般用的显著性水平是:
- 取 α = 0.01 alpha = 0.01 α=0.01,拒绝 H 0 H_0 H0,称因素A的影响(或A各水平的差异)非常显著
- 取 α = 0.01 alpha = 0.01 α=0.01,不拒绝 H 0 H_0 H0;而取 α = 0.05 alpha = 0.05 α=0.05,拒绝 H 0 H_0 H0,称因素A的影响显著
- 取 α = 0.05 alpha = 0.05 α=0.05,不拒绝 H 0 H_0 H0,称因素A的无显著影响
Matlab实现——anova1
处理均衡数据(各组数据个数相等)的用法为:p=anova1(x)
(注意是1而不是l)
这里返回值 p p p是一个概率,当 p > α p>alpha p>α时,接受 H 0 H_0 H0, x x x为 m × r m times r m×r, x x x的每一列是一个水平的数据(这里各个水平上的样本容量 n i = m n_i = m ni=m)。另外,还输出一个方差表和一个Box图
示例:
代码运行结果:
处理非均衡数据(各组数据个数不等)的用法为:p=anova1(x,group)
x x x为向量,从第1组到第 r r r组数据依次排列: g r o u p group group为与 x x x同长度的向量,标志 x x x中数据的组别(在于 x x x第 i i i组数据相对应的位置出输入整数 i ( i = 1 , 2 , . . . , 4 ) i(i=1,2,…,4) i(i=1,2,...,4))
示例:
代码运行结果:
多重比较
代码运行结果:
双因素方差分析
——考虑两个因素A,B对指标的影响。A,B各划分几个水平,对每一个水平组合做若干次试验,对所得数据进行方差分析,检验两因素是否对分别对指标有显著影响,或者还要进一步检验两因素是否对指标有显著的交互影响
Matlab实现——anova2
p=anova2(x,reps)
其中, x x x不同列的数据表示单一因素的变化情况,不同行中的数据表示另一因素的变化情况。如果每一“单元”有不止一个观测值,则用参数reps
来表明每个“单元”多个观测值的不同标号,即reps
给出重复试验的次数 t t t。
例如,下面的矩阵中,列因素有3个水平,行因素有2个水平,但每组水平有两组样本,相应地用下标来标识。
多因素方差分析
前面介绍了一个或两个因素的试验,由于因素较少,我们可以对不同因素的所有可能的水平组合做试验——全面试验
当因素较多时,实际难以实现全面试验,故而需考虑合理的试验方案,使得试验次数不多,但也能得到比较满意的结果。 ——一种可行的方案:正交试验设计。
正交表:一系列规格化的表格,每一个表都有一个记号,如 L 9 ( 3 4 ) L_9(3^4) L9(34)
最简单的正交表是 L 4 ( 2 3 ) L_4(2^3) L4(23),其含意为:“L”代表正交表;L下角的数字“4”表示有 4 横行,简称行,即要做四次试验;括号内的指数“3”表示有3 纵列,简称列,即最多允许安排的因素是3 个;括号内的数“2”表示表的主要部分只有2 种数字,即因素有两种水平1与2。
正交表的特点是其安排的试验方法具有均衡搭配特性:
- 每列中数字出现的次数相同,如 L 9 ( 3 4 ) L_9(3^4) L9(34)表每列中数字1,2,3均出现三次
- 任取两列数字的搭配都是均衡的,如 L 9 ( 3 4 ) L_9(3^4) L9(34)表里每两列中 ( 1 , 1 ) (1,1) (1,1), ( 2 , 2 ) (2,2) (2,2),…, ( 3 , 3 ) (3,3) (3,3)九种组合各出现一次
这种均衡性使得根据正交表安排的试验,其试验结果具有很好的可比性,易于进行统计分析。
用正交表安排试验时,根据因素和水平个数的多少以及试验工作量的大小来考虑选用哪张正交表。例如:
参考文献
[1] 司守奎.数学建模算法与程序[M].海军航空工程学院, 2007
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/181805.html原文链接:https://javaforall.cn