优思学院｜六西格玛中的非正态的数据如何处理？教你这一招

2022-07-06 14:45:37 浏览数 (2)

正态分布的假设，经常应用于很多统计分析方法中，例如控制图（Control Chart）、制程能力分析（Cp/Cpk）、t-检验、及变异数分析 (Analysis of variance, ANOVA)等等。

当数据不是正态分布时，则此类资料非服从或接近正态分布，我们必须进一步探讨并采取补救措施，包括调查原因、或者进行数据转换、或使用其他类型的分布)。

实际上，不少制程与可靠度资料均非呈现正态分布，而大部分六西格玛与制程能力分析工具，均假设资料为正态分布。所以，我们作为数据分析者、六西格玛绿带、黑带、质量工程师等都应该了解一下转换数据的方法。

统计学家George Box and David Cox发展出一套方法公式用以鉴别出一个适当的指数(Lambda=l) ，转换数据成为正态分布样态(形状)，这个Lambda值代表资料的次方数。为了达到此目的，Box-Cox转换方法自Lambda=-5到 Lambda= 5间找寻最佳的值。

非正态的数据可以利用Box Cox Transformation 转化为正态的数据，这一个颇常用的方法。

从上图中，P<0.005，因此数据不遵循正态分布，从直方图中可以明显看出数据偏向一边。

从上图中，P值>0.05，因此很明显，数据遵循正态分布，从直方图中我们也可以看到数据也是均匀分布的。

0 人点赞