收藏 分享(赏)

建筑工程造价聚类分析.docx

上传人:西米老师 文档编号:2275463 上传时间:2018-09-09 格式:DOCX 页数:6 大小:17.26KB
下载 相关 举报
建筑工程造价聚类分析.docx_第1页
第1页 / 共6页
建筑工程造价聚类分析.docx_第2页
第2页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、建筑工程造价聚类分析摘要:为了解决建筑工程造价预测模型建模复杂、未考虑地区差异等问题,利用聚类分析和主成分回归分析建立了一种居住建筑工程造价预测模型。首先利用单位面积建筑工程造价对 30 个地区的居住建筑工程进行聚类分析,将 30 个地区划分为四类。然后将地区类别作为影响因素加入到线性回归模型,通过主成分回归分析得到居住建筑工程造价的预测模型。该模型预测误差在 10%以内,且明确了地区类别对居住建筑工程造价存在显著影响。关键词:造价预测;聚类分析;主成分分析;回归模型;地区因素建筑工程的造价预测是可行性研究和成本管理的重要内容,直接影响项目的投资决策。由于前期缺乏详细信息,因此传统的预测方法主

2、要是单位面积指标法,预测的局限性较大、可靠性不高1。为了解决建筑工程造价预测问题,研究人员基于已有工程数据提出了许多预测模型。基于最小二乘法的多元线性回归模型,由于估算速度快、建模过程简单,得到研究者广泛应用23。由于线性回归模型存在 ACH 效应、共线性等问题,因此不少学者利用 GACH 模型、主成分回归、AIM 模型等提出了改良的回归模型48。近年来神经网络技术得到普及,不少研究者利用灰色关联神经网络、BP 神经网络、 BF 神经网络等建立了工程造价预测模型,得到了不错的预测效果,但是神经网络也存在建模过程复杂,训练样本数量要求较高等问题912 。为了解决神经网络算法的不足,不少学者利用支

3、持矢量机(SVM) 、最小二乘支持矢量机(LSSVM)建立了模型,解决了工程造价数据的混沌性和时变性问题1314。另外,上述预测模型考虑的因素主要包括建筑面积、基础形式、层数、门窗率等,均未考虑地区差异的影响。由于我国不同地区经济发展水平、人力成本、物料成本的差异很大,导致各地区建筑工程造价有很大的区别,但是目前缺乏相关的研究。上述研究要么采用同一地区的样本建立预测模型,得到的模型只适用于当地14 ;要么笼统地采用不同地区的样本建立预测模型,模型的精度受到样本数量的制约1011 。为了解决工程造价的地区差异问题,本文利用全国 30 个省会城市和直辖市(不包括港澳台和西藏)的居住建筑工程造价数据

4、,利用聚类分析将城市划分为不同的类,在此基础上建立多元线性回归模型,加入地区因子作为影响因素,在保证模型预测精度的同时确定建筑工程造价的地区差异。1 居住建筑工程造价的聚类分析本文采用系统聚类法对国内 30 个不同省市的居住建筑工程造价进行聚类分析。系统聚类法的基本思想如下:将 n 个样本各自作为一类,并规定样本之间的距离以及类与类之间的距离,将距离最近的两类合并为一个新类( 即并类); 然后重新计算新类与其他类的距离,重复并类过程,直到所有样本合并成一类,最后形成聚类树形图15。选择何种工程造价指标作为聚类分析的依据,影响到地区类别划分的准确性。建筑工程总造价包括基本的 6 个部分:建筑工程

5、、装饰工程、给排水工程、采暖通风工程、强电工程和弱电工程,如果以总造价指标进行聚类分析,那么会存在以下问题:上海虽然人工费和材料费较高,但是居住建筑不需要采暖工程,因此单位建筑面积综合造价与济南等北方城市相仿,这样上海和济南同为一类并不具有可解释性和实际的意义。而“建筑工程” 是建筑造价的基本单元,因此本文仅针对建筑工程的造价进行聚类分析,装饰工程等其余五项由于不同项目采用的标准差异很大,聚类结果不具有解释性,不在分析范围内。本文的聚类分析样本选自“广联达指标网”,来源于全国 30 个省会城市和直辖市( 由于数据不全,不包括港澳台和西藏 )的居住工程项目实际经济指标。聚类方法采用上述的可变类平

6、均法进行聚类。最终,通过不一致性系数将 30 个省市分为四类,第一类地区:北京、天津、上海; 第二类地区:江苏、浙江、福建、湖北、广东、海南、陕西、青海;第三类地区: 河北、内蒙古、辽宁、江西、河南、四川;第四类地区: 山西、吉林、黑龙江、安徽、山东、湖南、广西、重庆、贵州、云南、甘肃、宁夏、新疆。2 居住建筑工程造价预测模型的实证研究21 变量描述本文选择 14 个居住建筑工程造价的影响因素作为回归模型的自变量。其中,有 8 项定量指标:地上建筑面积、地下建筑面积、地上层数、地下层数、地上层高、地下层高、门窗数量、当年工程造价指数;有 6 项定性指标:基础类别、桩基类别、结构形式、抗震等级、

7、施工环境、地区类别。本文选择单位面积建筑工程造价作为因变量。表中,定量指标直接采用选择样本的实际数值,定性指标采用两元虚拟和分等赋值的量化方法。两元虚拟变量为施工环境,施工环境优良的为 1,施工环境较差则为 0。其余均为分等赋值变量。地区类别:1 代表第一类地区,2 代表第二类地区,3代表第三类地区,4 代表第四类地区。2 2 实证方法本文选择主成分分析法进行参数估计,以解决传统线性回归方法存在的共线性问题。具体程序如下:(1) 首先我们对变量进行标准化处理,以解决不同变量的量纲和单位的差别,在此调用 MATLAB 的 ZSCOE 函数进行标准化。(2)主成分分析。利用 MATLAB 的主成分

8、工具箱进行主成分分析,由相关系数矩阵得到主成分、特征值、贡献率及累计贡献率,如表 2 所示。(3)选择累计贡献率达到 900125%的前4 个主成分因子作为模型自变量,各因子与各变量的权重,如表 3所示。(4) 利用 3 个主成分因子对模型进行线性回归分析,模型的估计方法为最小二乘法,最终结果如式 1 和式 2 所示。(5) 对模型估计结果进行检验,包括显著性检验、共线性检验、异方差检验、自相关检验和残差正态性检验,如表 4 所示。3 实证研究结果及检验将 4 个主成分因子作为自变量,单位面积建筑工程造价作为因变量,对模型进行线性回归分析。模型的估计方法为最小二乘法。据此得到主成分回归模型如下

9、:P=0001+02634F102858F201730F3+03582F4(1) 其中,P 为单位面积建筑工程造价的无量纲,F1F4 为 4 个主成分因子。将表 4 中主成分权重代入式 1,可得 x1x14 变量与 P 的回归模型如下:(1)显著性检验和方差检验。拟合优度为2 均在 097 以上,表征回归离差占总离差的百分比(数值越接近 1 说明线性关系越好 ),可知自变量和因变量之间有线性关系,模型具有良好的解释能力。取显著水平 5%,F值远远大于 F 检验的临界值 F(p,n p1)=00128 ,说明所有的回归模型从整体上成立。取显著水平为 5%,T 检验的临界值为T(np1)=1 06

10、,所有回归系数都在 5%的水平下显著,认为变量显著性较好。回归方程方差分析的显著性检验值为 p 值均小于001,说明方程是高度显著的,表明自变量和因变量之间的线性关系能够成立。(2)共线性检验。通过方差膨胀因子(VIF 值) 诊断自变量间的多重共线性,自变量的 VIF 值都小于 5,可以认为模型不存在多重共线性。(3)异方差检验。利用 spearman 等级相关检验法检验回归模型的异方差情况(检验结果大于 005 则不存在异方差),模型残差检验结果均大于 005,不存在异方差现象。 (4)自相关检验。利用 DW 值检验模型的自相关性。线性模型的 DW值为 18968,说明模型的相邻两点残差为正

11、相关,但其数值非常接近 2(DW=2,无自相关) ,可以认为模型中的残差近似不存在自相关性。(5)地区类别对建筑工程造价的影响。在回归模型中,地区类别的回归系数为03077,说明地区类别与单位面积建筑工程造价成反比,符合实际情况。例如,第一类区(北京、天津、上海)的地区类别最小,单位建筑面积工程造价也最高。而且从标准化的回归系数来看,在 14 个影响因素中地区类别对单位建筑面积工程造价的影响最为显著。(6)模型的精度验证。随机抽取 100 个样本中的 3 个样本,将自变量代入模型中进行估算,将预测结果与实际造价相对比,验证模型的精度。结果表明,上述 3 个样本的预测造价与决算造价偏差都在 10%以下,精度符合我国可行性研究的规定,证明该预测模型精度可靠,能够满足投资决策阶段对建筑工程造价的预测。4 结语当前建筑工程造价预测模型存在建模复杂、未考虑地区差异等问题,利用单位面积建筑工程造价对 30 个地区的居住建筑工程进行聚类分析,将 30 个地区划分为四类。将地区类别作为影响因素加入到线性回归模型,通过主成分回归分析得到居住建筑工程造价的预测模型。统计检验表明,该模型解决了传统线性模型存在的共线性问题,同时得到了地区类别对居住建筑工程造价的影响。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑环境 > 建筑论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报