1、支持向量机在 GDP 回归预测中的应用研究控制管理文章编号:1008-0570(2007)11 3-001702支持向量机在 GDP 回归预测中的应用研究ResearchonapplyingSVMtotheregressionofGDP(1.南昌大学 ;2 思创数码科技股份有限公司)胡艳国武友新江恭和HUYANGUOWUY0UXINJIANGGONGHE摘要:支持向量机是一种新的回归方法,介绍了基于支持向量机的回归建模技术 ,并应用于 GDP 的回归预测.GDP 属性子集的特点是训练数据量比较少,含有稀疏数据.在转换,添加,下钻 GDP 相关属性的情况下对支持向量机的参数进行实验分析.实验结果
2、显示支持向量机能很好的处理属性集的变化并得到很好的预测效果.关键词:支持向量机;数据挖掘;国民生产总值中图分类号:TP311 文献标识码:AAbstract:SVM(supportvectormachines)isoneofthelatestregressionmethods.ThepaperfirstintroducesthetechnologyofconstructionbasedonSVMandappliesittotheregressionofGDP,ThedataofGDPattributesarefewerandsparse.WhentheattributesofGDParecon
3、vertedoraddedorextended,analyzestheparameterssensitivityofSVM.TheresultofexperimentsshowthatSVMcandealwellwiththechangeofattributessetandgaingoodaccuracy.Keywords:SVM,datamining,GDP.刖昌支持向量机(SVM)是 Vpanik 等人提出的一种全新的机器学习方法.由于其优越的学习能力,在国内外学术界受到广泛重视,并已在模式识别和函数估计方面取得了越来越多的应用.近年来,伴随着政府信息化程度的不断提高以及政府信息系统的不断
4、完善,获得了大量的关于经济指标的宝贵数据资源.对宏观经济预测对于政府的决策支持有巨大的作用.GDP是宏观经济指标中使用最多的指标之一.由于影响 GDP 的因素很多,在选择预测的属性集时有多种选择方式.适合于研究支持向量机在选择不同属性集预测同一目标的能力.基于这个思路.进行本文的应用研究.1 基于支持向量机的回归与预测利用 SVM 进行回归与预测的基本思想是通过一个非线性映射P 将数据 x.映射到一个高维特征空间 F,并在此空间进行线性回归,从而将低维特征空间的非线性回归问题转化为高维特征空间线性回归问题解决.由统计学习理论确定如下回归函数:/()=(to,()+6(1)其中:RF,F.(,)
5、表示内积 ,p 为 Rm 空间到 F 空间的非线性映射.XRm,为权向量,F.b 为偏置 .回归问题解决方法是找到函数 f,使经验风险最小化.用 SVM 解决回归问题是使经验风险与置信风险(模型的复杂度)之和最小,使预测模型具有很好的函数逼近能力和泛化能力.式(1)中P(x)已知,利用样本数据()(i,Y.)通过使如下泛函最小化 ,可求出式(1)中的和 b 估计值.胡艳国:硕士基金项目:2004 电子信息产业发展基金资助项目(信部运 20o41479 号项目名:基于 LINUX 的电子政务应用系统)【,】=【,】+11-11.=sc(e,)+11-11(2)其中一,为经验风险,l2 为置信风险
6、.c() 为模型的经验损失,c(.)为损失函数,ei=,() 一:一为样夺的预测值与真实值之差,s 为样本容量.由于p 是固定的,l 反映了模型在高维特征空间的复杂性,其值越小则置信风险越小.是用于控制样本训练损失与模型复杂性折中的正则化参数.对于给定的损失函数.该问题可作为一个二次规划问题解决.maxJ:一 Is 一 a-12;)(置),()+a(s)一 a(+s)(3)SS=s.t.0 C0C(4】求解可得到:=(一)(),6 可由任一支持向量代人求得,则可得非线性函数 f,厂():(一(),()+b(5)定义高维特征变换空间的内积运算为支持向量机的核函数:K(,)=(),(,),只需对变
7、量在原低维空问进行核函数运算即可得到其在高维空间的内积,因此求解凸二次规划问题得到非线性映射为,-厂()=(一 a/)K(X,)+b(6)fl2 预测模型的评价标准对构建的模型可以用如下统计量检验其拟合效果和预测结果:吣局订阅号.82-946360 元/年_l7 一控制管理中文核心期刊微计算机信息(管控一体化)2007 年第 23 卷第 11-3期(1)均方根误差:RMSE=, ()Y:输入值,:预测值;V,-7(2)平均绝对百分比误差.雎:喜;(3)平均绝对误差:MAE=lyI.3 实验3.1 数据准备本文的实验数据采用江西省 2005 年统计年鉴的统计数据.选取 19782004 年江西省
8、的 GDP 等经济指标数据.3.2 数据预处理3.2.1 数据提取首先.提取出与 GDP 直接相关的经济指标.如农业,工业等;其次,提取出与农业,工业等直接相关的指标,如与农业相关的有农,林,牧,渔.3.2.2 缺失值处理a)1978 年等年份早的缺失值取 0 或最小值;b)2004 年的缺失值取同指标最大值:c)重要的稀疏列.保持不变 .如房地产投资.3.3 实验一根据 GDP 的组成,选取的经济指标为:GDP, 下一年 GDP,第一产业,第二产业.工业,建筑业,第三产业,交通运输邮电业,批零贸易餐饮业,金融保险业(下一年 GDP 是预测的目标).3.3.1 高斯核回归C 值的选取 (使用高
9、斯核,叮=2.75,e=0.001).C 取不同值的误差如表 1.表 1Cl1020304050601O0RMSE230.6549.44l36.01829.84027.10324.26425.5l228.699E0.09490.03690.03440.03l40.0298002990.030400292MAEU5.2534.01926.4552274420.I79l9.998l9.96l18.262叮值的选取(使用高斯核,C=50,e=O.001). 叮取不同值的误差如表 2.表 2l22527534510RMSEU2.7653.49627.43124.264298404944l7ll5348
10、4.299MPE0.05l10.02690.03030.02990.03l40.03690.045l0.0741MAE5l_78623.1 鹋 l7.6l8l9.99822.74434.01944.94960.6423.4 实验二由于 GDP 具有时序的特点,支持向量机也具有处理时间序列数据的特点.给每项数据添加几个列(下一年的 GDP,以及前几年的 GDP)年数的选取(使用高斯核.C=50,o.=32.75,e-O.001). 年数取不同值误差如表 3.表 3年数 234567蹦 SE3L54637354.36650.65l79.648.78E0.0393650.0436410.048945
11、0.0489760.0842790.03589M 肛 24.3640.3643.094 互 65135.439.84由结果可知选两年年和下一年)比较好.3.5 实验三在实验二的基础上添加一稀疏列.因为房地产投资历史数据比较少,但是近几年对 GDP 的影响又很大,在此选择添加 .C 值的选取 (使用高斯核,叮:2.75,e=O.001).C 取不同值的误差如表 4.C151030501O0l 骼 E184.626648.27i0338.1538457.oo85780.33216109.2352MAPE0.097960.0426010.0326760.0317510.0384230.038696A
12、E1O0.461533.0892127.5131027.7088540.6859449.94336结果表明支持向量机在处理稀疏数据(房地产)时也能得到较高准确性.3.6 实验四将第一产业指标下钻,替代为农,林,牧,渔.C 值的选取 (使用高斯核,叮:2.75,e-O.001).C 取不同值的误差如表 5.表 5Cl51030501O0RMSE160.407775143.20852137.12345123.48783120.22305l16.19084MAPE0.0594620.0476300.049490400745320.07223970.072750lM 肛 86.9g03335l_728
13、69448.78141762.52756563.80838062.87887I图 1 预测结果4 结论本文采用支持向量机对 GDP 进行回归预测,并通过实验说明预测能达到比较高的精度.在相关属性发生变化的时候能通过选择核函数和调节参数来提高回归精度.当选取的属性多,模型更复杂,模型的方差变小,偏倚增大.将支持向量机应用于宏观经济预测.是一种新的宏观经济预测方法.并实验证明了该方法的适应性和准确性.创新点:从江西省政府决策支持综合服务系统中提取 .在建立宏观经济数据仓库的基础上.根据数据仓库,经济数据的特点,将支持向量机应用于宏观经济预测,是一种新的宏观经济预测方法.并实验证明了该方法的适应性和
14、准确性.参考文献【1VapnikVN.Thenatureofstatisticallearningtheory【 M.NewYork:Springer.1995:85-90.2】边肇祺 .张学工模式识别【M】.北京:清华大学出版社,2000【3】郑启鹏等支持向量机在银行贷款客户分类中的应用研究J 】微计算机信息 2005.11-3:2123411文龙,樊广俭,杨炳儒基于支持向量机的复杂时间序列预测研究J.2005,31(12):1-4【5】张浩然,汪晓东,张长江等一种新型回归支持向量机的学习算法J】测试技术 2006;20(2):168173(.f 转第 9 两一18360.,-L/年邮局订阅
15、号:82-946控制管理保持系统之间的底耦合,开发简单,也便于增减子系统,使各子系统的开发相对独立.由于事件是白定义的,应此方便用户对系统的某些特殊需求的定制.采用事件的集成方式要实现一个适合多种环境下的事件触发的模型,难度和复杂性都比较大.它不仅仅与需要支持的业务复杂度有关也和开发采用的环境有关.目前文中的这种方式实现比较简单,因此当事件比较多,效率问题不定能得到保障,此外,事件的映射是通过 xml 文件固定的,灵活性不足.5 结束语本文中提出了一种新的事件触发的集成方式,用于解决当前一些多子系统的的应用系统的集成,并且给 m 了一种实现方式.本文采用的这种事件集成方式主要针对 ERP 这样
16、的系统设计实现的,但是并不仅仅适用这些系统,对于那些对系统集成,二次开发要求比较高的系统都适用.实例化 Event 类,事件源远程嗣用事件管理,一,解析 l 映射艾件 I查找事件处理稃序l?/加戟相关 dll 组件 II理器图 2本文的创新观点:本文针对一些子系统集成性和二次开发性的高的复杂应用系统,提出了一种业务事件触发的集成技术,使得不同子系统之间完成底耦合的业务协作.参考文献【1RosenblumDS,WolfAL.AdesignframeworkforInternetScaleeventobselarationandnotificationJ】.ACMSIGSOFYSoftWareEn
17、gineeringNote1977,22(6):344-360.f2DollimoreG,KindbergJ,KindbergT.DistributedSystemsCon-ceptesandDesignM】北京 :机械工业出版社,.200303【3】张世兵刘强曾强,基于 Web 服务的应用集成框架的研究和实现 fJ】微计算机信息,2006,15(22):134BirbeckM.XML 高级编程【M】.裴剑锋,高伟,徐继伟译.北京机械工业出版社.200205【5ISIMONROBINSON.c#高级编程【M】敏波等译 ,清华大学出版社.200571【6】汪洋,巍峻,王振宇,可扩展可配置事件服务
18、体系结构J软件,2006,17(3):638648【7】徐晓飞.ERP 技术发展的现状,趋势及思考31ee 国制造业信息化.2003,1(12):1216.【8】陈启申.ER 从内部集成起步【M】电子工业出版社,2004 一O401作者简介:夏榆滨(1965 一),男,山东青岛人,副教授,主要研究方向:产品全生命周期管理,产品数据管理,工程信息集成技术 ,企业资源规划,办公自动化;吕婷婷(1981“),女,安徽合肥人,北京航空航天大学硕士生,主要研究方向:企业信息化,面向信息系统的可定制软构件技术.Biography:Xiayubin(1965 一),male,Shandong,ProfofB
19、eiHangUniversity,Doctor,Researcharea:PDM,PrjectInformationintegra-tiontechnology,EnterpriseResourceProgramming,OA.(100083 北京北京航空航天大学计算机学院)夏榆滨吕婷婷(CollegeofComputerScienceandTechnology,BeihangUni-versity,Beijing100083)XIAYubinLvTingting通讯地址:(100083 北京北京市海淀区知春路 29 号大运村公寓 6 号楼 1003B)夏榆滨(收稿日期:2007.8.03)(
20、修稿日期 :2007.10.05)(上接第 l8 页)作者简介:胡艳国(1982 一),男(汉族), 江西南昌人,硕士,主要研究方向:数据库,数据挖掘,电子政务;武友新(1963 一)男(汉族),江西南昌人,教授,硕导;江恭和(1973 一)男(汉族), 江西临川人,高级工程师Biography:HuYanguo(1982-),Male(theHanNationality),BorninNanchangCityofJiangxiProvince,MasterofScience,Specialin:DatabaseDevelopment,DataMining,ElectronicGovernme
21、ntAffair.(330029 江西南昌南昌大学信息工程学院)胡艳国武友新(330029 江西南昌思创数码科技股份有限公司)江恭和(InstituteofInformationengineeringofNanchangUniversity,Nanchang,330029,China)HuYanGuoWuYouXin(Strongdigitaltechnologicaljoint-stockcompany,Nanchang,33O029.China)JiangGongHe通讯地址:(330029 江西省南昌市高新大街火炬大道 681 号思创数码科技股份有限公司)江恭和(收稿日期:2007.8.
22、03)(修稿日期 :2007.10.05)变频器与软启动器应用 200 例凡有电机的地方,均需要软启动器与变频器,一是安全,二是节能,三是环保.冶金,石化,化工企业的大设备运行.港口,码头,矿山的装载机械,掘进机械,水泥厂的窑炉动力机械,破碎机械,机床厂的各种设备与产品,电力(发电与运行)机械 ,铁路行业的电力机车,内燃机车与货场的行车,轻工动力机械,造纸机械,印刷机械,大厦中的电梯,中央空调装置,恒压供水装置,各种窑炉的控制设备,大型闸门起吊设备,各种伺服阀门,大型雷达动力驱动系统,有轨,无轨城市电车.电机无处不在,变频器与软启动器的用场无所不在.高压变频,中低变频,直流调速,交流变频,交交变频,伺服驱动,各种启动,励磁,电源解决均在本书之中,既符合设计使用人员查阅,又适合采购主管人员查询.好书大家拥有,200 个实用案例与大量的广告总会有适应您的一款.本书已出版.大 16 开,每册定价 110 元(含邮费).预购者请将书款及邮寄费通过邮局汇款至地址:北京海淀区皂君庙 14 号院鑫雅苑 6 号楼 601 室微计算机信息编辑部邮编:100081电话:010.62132436O10-62192616(T/F)htto-I/wwwautocontrolcom(313htlt?/wwwalatocontmlcrt翻自控嘲邮局订阅号:82.946360.,L/#一 9 一