1、数据归一化处理 1.我有一个问题不太明白,神经网络在训练时,先对数据进行归一化处理,按照常理训练完之后应该对数据再进行反归一化啊,可是再很多资料上根本就看不出有反归一化这个步骤,而且很多时候训练效果不是很好。请问,哪个大侠能帮帮我啊2.看一下 MATLAB 里的 premnmx 函数和 postmnmx 函数.它们一个是归一一个是反归一3.并不是归一化的数据训练效果就好4.我也遇到过类似的问题,有篇论文就是用 postmnmx 函数.效果不好可能是样本数据不太准.5.可以采用标准化 PRESTD,效果很好。6.样本数据和测试数据是否放在一起归一化?7.应该将样本数据和测试数据放在一起归一化,不
2、然如果测试数据中有的值比样本数据最大值还大,岂不是超过 1 了?神经网络训练的时候,应该考虑极值情况,即归一化的时候要考虑你所需要识别参数的极值,以极值作分母,这样可能效果更好一点。8.激发函数如果选用的是倒 s 型函数,应不存在归一化的问题吧9.我想问大家一下:在神经网络中,只有一个函数即:purelin 这个函数对训练的输出数据不用归一化,而象 logsig 和tansig 函数都要归一化(如果数据范围不在-1,1或0,1之间).那既然用 purelin 函数可以不用归一化,为何又是还用归一化呢?用神经网络里的 PRESTD, PREPCA, POSTMNMX, TRAMNMX 等函数归一
3、化和直接用 purelin 这个函数有什么区别啊? 我作负荷预测时,象不用归一化的效果很好呀!10.purelin 没有作归一化啊,你用 logsig 和 tansig 作为神经元激励函数,输出范围自然限制在-1,1或0,1之间了11.我所知道的关于归一化:归一化化定义:我是这样认为的,归一化化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。在 matlab 里面,用于归一化的方法共有三中,(1)premnmx、postmnmx、tramnmx(2)prestd、poststd、trastd(3)是用
4、 matlab 语言自己编程。premnmx 指的是归一到1 1,prestd 归一到单位方差和零均值。(3)关于自己编程一般是归一到0.1 0.9 。具体用法见下面实例。为什么要用归一化?为什么要用归一化呢?首先先说一个概念,叫做奇异样本数据,所谓奇异样本数据数据指的是相对于其他输入样本特别大或特别小的样本矢量。下面举例:m=0.11 0.15 0.32 0.45 30;0.13 0.24 0.27 0.25 45;其中的第五列数据相对于其他 4 列数据就可以成为奇异样本数据(下面所说的网络均值 bp)。奇异样本数据存在所引起的网络训练时间增加,并可能引起网络无法收敛,所以对于训练样本存在奇
5、异样本数据的数据集在训练之前,最好先进形归一化,若不存在奇异样本数据,则不需要事先归一化。具体举例:close allclearecho onclc%BP 建模%原始数据归一化m_data=1047.92 1047.83 0.39 0.39 1.0 3500 5075;1047.83 1047.68 0.39 0.40 1.0 3452 4912;1047.68 1047.52 0.40 0.41 1.0 3404 4749;1047.52 1047.27 0.41 0.42 1.0 3356 4586;1047.27 1047.41 0.42 0.43 1.0 3308 4423;1046.
6、73 1046.74 1.70 1.80 0.75 2733 2465;1046.74 1046.82 1.80 1.78 0.75 2419 2185;1046.82 1046.73 1.78 1.75 0.75 2105 1905;1046.73 1046.48 1.75 1.85 0.70 1791 1625;1046.48 1046.03 1.85 1.82 0.70 1477 1345;1046.03 1045.33 1.82 1.68 0.70 1163 1065;1045.33 1044.95 1.68 1.71 0.70 849 785;1044.95 1045.21 1.71
7、 1.72 0.70 533 508;1045.21 1045.64 1.72 1.70 0.70 567 526;1045.64 1045.44 1.70 1.69 0.70 601 544;1045.44 1045.78 1.69 1.69 0.70 635 562;1045.78 1046.20 1.69 1.52 0.75 667 580;%定义网络输入 p 和期望输出 tpauseclcp1=m_data(:,1:5);t1=m_data(:,6:7);p=p1;t=t1;pn,minp,maxp,tn,mint,maxt=premnmx(p,t)%设置网络隐单元的神经元数(530
8、验证后 5 个最好)n=5;%建立相应的 BP 网络pauseclcnet=newff(minmax(pn),n,2,tansig,purelin,traingdm);inputWeights=net.IW1,1;inputbias=net.b1;layerWeights=net.IW1,1;layerbias=net.b2;pauseclc% 训练网络net.trainParam.show=50;net.trainParam.lr=0.05;net.trainParam.mc=0.9;net.trainParam.epochs=200000;net.trainParam.goal=1e-3;
9、pauseclc%调用 TRAINGDM 算法训练 BP 网络net=train(net,pn,tn);%对 BP 网络进行仿真A=sim(net,pn);E=A-tn;M=sse(E)N=mse(E)pauseclcp2=1046.20 1046.05 1.52 1.538 0.75;1046.05 1046.85 1.538 1.510 0.75;1046.85 1046.60 1.510 1.408 0.75;1046.60 1046.77 1.408 1.403 0.75;1046.77 1047.18 1.403 1.319 0.75;p2=p2;p2n=tramnmx(p2,min
10、p,maxp);a2n=sim(net,p2n);a2=postmnmx(a2n,mint,maxt)echo offpauseclc程序说明:所用样本数据(见 m_data)包括输入和输出数据,都先进行归一化,还有一个问题就是你要进行预测的样本数据(见本例 p2)在进行仿真前,必须要用 tramnmx 函数进行事先归一化处理,然后才能用于预测,最后的仿真结果要用 postmnmx 进行反归一,这时的输出数据才是您所需要的预测结果。个人认为:tansig、purelin、logsig 是网络结构的传递函数,本身和归一化没什么直接关系,归一化只是一种数据预处理方法。12.“tansig、pure
11、lin、logsig 是网络结构的传递函数,本身和归一化没什么直接关系,归一化只是一种数据预处理方法“,说的有问题,若用 premnmx 将输入输出归一化,其输出值在-1,1之间,若输出层传函为 logsig 则无论怎么训练,输出值都不可能在-1,1之间.13.我感觉如果激发函数是 S 型函数,应该不用规一化处理,但是效果不如规一化处理的好,不知道为什么?14.我认为有可能是数据太大或太多,将其归一化之后,有利于快速的调整神经网络的网络结构,或者如同 terry2008所说存在奇异值也肯定有影响。当然,效果好就选谁!15.如果输入数据中含有频率、幅值、相位以及其他一些不同类型的数据,需要对他们
12、进行什么处理,才能用于网络的训练?只是简单的归一化就行吗?16.如果数据的维数太多,可以考虑用 prepca 进行主元分析,不知道 silvercx 所说的简单的归一化是什么意思?我现在还不知道其他预处理方法?什么事都得试一下,试过了就知道,你可可以拿出具体问题一起讨论!17.我认为讨论之前要搞清一个数学问题,就是每种激励函数的定义域和值域,我们都知道 tansig 的定义域是任意实数,值域为(1,1)、purelin 定义域和值域都是任意实数、logsig 定义域任意实数,值域是(0 ,1)。所以在具体实际中使用用事先考虑好这个问题,logsig 的值域是(0,1),当然不可能使输出在(1,
13、1)了。我所说的:“tansig、purelin、logsig 是网络结构的传递函数,本身和归一化没什么直接关系,归一化只是一种数据预处理方法“,我并没说没有间接关系。18.如果输入样本的数据组成为 In=频率; 幅值; 相位我只用 premnmx 对 In 进行归一化,训练 BP 网络,得到一个目标输出 Out,其数据组成也为 Out=频率; 幅值; 相位。这样子可以吗?总觉得把不同类型的数据放一起有点不妥。19.完全可以,不过在输入数据和输出数据啊安排上可能要以时间序列的方式来安排。例如,用第 1,2,3,4 时刻的数据预测第 5 时刻的数据,用第 2,3,4,5 时刻的数据预测第 6 时
14、刻的数据,依次类推,可以组成一定的输入输出对,以上只是举个例子,只是说明这种数据组织方法,silvercx 在实际中可以根据自己的要解决的问题,自己确定,我只是提供一个参考方法。有问题再讨论!20.目前在我的项目中,我是这样子来训练 BP 网络的。在变频器输出频率为 4550Hz 之间,采集电机的转矩(T)、转速(n)和另外一个目标量(RL)。然后我对这些数据进行 FFT 变换,得到他们前几次谐波的幅值和相位。归一化。然后我利用两个网络分别训练幅值和相位。(下面 Am 表示幅值,Ph 表示相位,即 AmT45,表示在 45Hz 时电机的转矩前几次谐波幅值)网络 1:in=AmT45 AmT46
15、 AmT47 AmT48 AmT49 AmT50;Amn45 Amn46 Amn47 Amn48 Amn49 Amn50;out=AmRL45 AmRL46 AmRL47 AmRL48 AmRL49 AmRL50;网络 2:in=PhT45 PhT46 PhT47 PhT48 PhT49 PhT50;Phn45 Phn46 Phn47 Phn48 Phn49 Phn50;out=PhRL45 PhRL46 PhRL47 PhRL48 PhRL49 PhRL50;然后利用所训练的网络去测试其他频率下的数据 RL。这样进行网络的训练行不行,还是把幅值和相位放在一个网络内训练的效果好?21.在神经网
16、络 BP 网的预测中,对数据进行归一化处理,完了输出再反归一化。如果是单入单出系统好办,如果是多入单出系统,那么反归一化时,最大值和最小值怎么确定呢?22.你可以自己指定,或者使用在训练网络时候确定的最大值和最小值23.请问 minmax(p),p 是输入样本,它的功能是做归一化吗,在 MATLAB 里面.谢谢!24.我认为,如果各维的数据不进行归一化处理,那么各维对误差函数的影响差异会很大。从而会影响学习性能。不知道对不对?25.那样本数据测试数据预测数据期望数据要一起进行归一化吗?26.我所知道的关于归一化:归一化化定义:我是这样认为的,归一化化就是要把你需要处理的数据经过处理后(通过某种
17、算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。在 matlab 里面,用于归一化的方法共有三中,(1)premnmx、postmnmx、tramnmx(2)prestd、poststd、trastd(3)是用 matlab 语言自己编程。premnmx 指的是归一到1 1,prestd 归一到单位方差和零均值。(3)关于自己编程一般是归一到0.1 0.9 。具体用法见下面实例。为什么要用归一化?为什么要用归一化呢?首先先说一个概念,叫做奇异样本数据,所谓奇异样本数据数据指的是相对于其他输入样本特别大或特别小的样本矢量。下面举例:m=0.11
18、0.15 0.32 0.45 30;0.13 0.24 0.27 0.25 45;其中的第五列数据相对于其他 4 列数据就可以成为奇异样本数据(下面所说的网络均值 bp)。奇异样本数据存在所引起的网络训练时间增加,并可能引起网络无法收敛,所以对于训练样本存在奇异样本数据的数据集在训练之前,最好先进形归一化,若不存在奇异样本数据,则不需要事先归一化。具体举例:程序说明:所用样本数据(见 m_data)包括输入和输出数据,都先进行归一化,还有一个问题就是你要进行预测的样本数据(见本例 p2)在进行仿真前,必须要用 tramnmx 函数进行事先归一化处理,然后才能用于预测,最后的仿真结果要用 pos
19、tmnmx 进行反归一,这时的输出数据才是您所需要的预测结果。个人认为:tansig、purelin、logsig 是网络结构的传递函数,本身和归一化没什么直接关系,归一化只是一种数据预处理方法。你好,我用了你的归一化方法,但当 p2 数据取比这些数大很多的值时,好像就不行了,出现了这样的问题,是不是数值超出了最大值的原因?我用的是 GRNN 网络Warning: Divide by zero. In normprod at 73In calca at 119In network.sim at 204In xgi at 60a2=postmnmx(a2n,mint,maxt)a2 =Colum
20、ns 1 through 91602 1602 NaN NaN NaN NaN NaN NaN NaNColumn 10NaN29.而且预测值受样本期望输出的最大值限制,30.这个问题我提出来很多天了,为什么没有人表示意见呢,是这个问题本身就是神经网络的 BUG,还是,我走的路偏了,对神经网络本质误解所致,大家多多指教阿,我在这等很久了呀!非常不好意思,请教一问题:31.利用归一化后的数据建了 BP 网络,但最后预测值在反归一化前却超出了-1,+1,不知问题出在哪?32.小波神经网络对于时间序列预测在文献上报道得神乎其神,据称预测精度相对偏差平均达 5%以下。鄙人尝试后认为,小波神经网络只是加
21、快了收敛速度,而预测精度决定于问题本身,很多数据预测结果并不能达到以上效果。欢迎各位仁兄讨论改进方法。33.有个问题:归一化的时候我认为应该考虑数据的物理含义34.为什么我的简单的归一化程序总是错的?谢各位大虾指点p=1520 510 5.155 33.88;1468 521 5.321 35.79;.共 5 行;t=0.7 1.9;0.6 1.798;.共 10 行;for i=1:4P(i,: )=(p(i,: )-min(p(i,: )/(max(p(i,: )-min(p(i,: );就是这行总说有错,到底是程序错还是软件不好?end此程序出自,第 269 页,类似的归一化在我机子里都
22、说不对,急死了,等毕业呢.35.不要用这个归一化啊,换函数 premnmx 试试36.为什么要归一化?神经网络输入的一维代表一个特征,当神经网络的输入是多维时,要识别的模式有多个特征,当这多个特征的数据相差很大,如几个数量级时,就需要归一化,变成相同数量级,以防某些数值低的特征被淹没。数据标准化/归一化方法归一化方法(Normalization Method)1。 把数变为(0,1)之间的小数主要是为了数据处理方便提出来的,把数据映射到 01 范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。2 。把有量纲表达式变为无量纲表达式归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,
23、化为无量纲的表达式,成为纯量。 比如,复数阻抗可以归一化书写:Z = R + jL = R(1 + jL/R) ,复数部分变成了纯数量了,没有量纲。 另外,微波之中也就是电路分析、信号系统、电磁波传输等,有很多运算都可以如此处理,既保证了运算的便捷,又能凸现出物理量的本质含义。/C+实现的归一化和反归一化处理函数/void _fastcall TModelManage:TranslateData(TModel* pModel,int Id,double *Value,int Flag)/转换函数类型int iChgFunc;/节点对应的最大、最小值double dMaxValue,dMinVa
24、lue;/取节点配置信息:转换函数类型,最大值,最小值GetNodeConfValue(pModel-ConfTable,Id,if(Flag=1) /仿真时不取边界值,以避免仿真结果误差太大if(*Value=(dMaxValue*0.995)*Value=dMaxValue*0.995;elseif(*Value=dMaxValue)*Value=dMaxValue;/线性函数转换,转换在 0-1 之内if(iChgFunc=0)*Value=(*Value-dMinValue)/(dMaxValue-dMinValue);/用 atan 函数转换在 0-1 之内else if(iChgF
25、unc=2)*Value=atan(*Value)*2/M_PI;/用 log 函数转换else if(iChgFunc=1)if(*Value1)*Value=*Value/log10(dMaxValue); /转换为 0-1 之间/不用转换else if(iChgFunc=3)*Value=*Value;*Value=(0.5-0.001)/0.5)*(*Value)+0.001; /用线性函数把数据转换为 0.001-0.0.9995 之间/反数据转换,主要是针对仿真结果要反算回实际预测的值void _fastcall TModelManage:UnTranslateData(TMode
26、l* pModel,int Id,double *Value,int Flag)/转换函数类型int iChgFunc;/节点对应的最大、最小值double dMaxValue,dMinValue;/取节点配置信息:转换函数类型,最大值,最小值GetNodeConfValue(pModel-ConfTable,Id,*Value=(*Value)-0.001)*0.5)/(0.5-0.001); /对应于-用线性函数把数据转换为 0.001-0.0.9995 之间/反线性函数转换if(iChgFunc=0)*Value=(*Value)*(dMaxValue-dMinValue)+dMinValue;/用 tan 函数转换else if(iChgFunc=2)*Value=tan(*Value)*M_PI/2;/用反 log 函数转换else if(iChgFunc=1)*Value=pow(10,(*Value); /用反对数方式函数转换(放大)else if(iChgFunc=3)*Value=*Value; /不用转换