在神经网络构建之前,需要对数据进行归一化处理,为什么要归一化? 因为不同数据范围不同,比如一个特征的数据范围为(1,5),另一个为(100,1000),会导致特征之间对结果的影响不同,因此需要将它们归一化处理,压缩到(0,1)这个范围之内.
归一化方法: 一、min-max标准化(Min-Max Normalization) 也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0 - 1]之间。转换函数如下:
matlab主要调用形式有:
- [Y,PS] = mapminmax(X,YMIN,YMAX)
- [Y,PS] = mapminmax(X,FP)
- Y = mapminmax(‘apply’,X,PS)
- X = mapminmax(‘reverse’,Y,PS)
- dx_dy = mapminmax(‘dx_dy’,X,Y,PS)
二、Z-score标准化方法 这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,转化函数为:
matlab主要调用形式有:
- [Y,PS] = mapstd(X,ymean,ystd)
- [Y,PS] = mapstd(X,FP)
- Y = mapstd(‘apply’,X,PS)
- X = mapstd(‘reverse’,Y,PS)
- dx_dy = mapstd(‘dx_dy’,X,Y,PS)