1、我国主要城市空气质量分析温桂林厦门大学理学院 地信0911 2009842023【摘要】:空气质量的好坏严重影响到人们的身体健康,已被逐渐提上日程,本文通过聚类分析法和主成分分析法,研究现阶段哪些城市的空气质量好,以及各参数对坏境质量的影响。结果显示福州,南宁,海口,拉萨的空气质量相对较好,可吸入颗粒物是影响空气质量的主导因素。【关键词】:空气质量;影响指标;聚类分析;主成分分析0 前言我国当前空气概况:近年来,我国经济飞速发展,这有赖于工业的进步的突出贡献,然而,工业也带来了一系列环境问题,特别是空气方面的问题。随着可吸入颗粒物,二氧化硫,酸雨等有害物质的增加,人们疾病的发生率也逐年提高。研
2、究意义:洁 净 大 气 是 人 类 赖 于 生 存 的 必 要 条 件 之 一 , 一 个 人 在 五 个 星 期 内 不 吃 饭 或 5天 内 不 喝 水 , 尚 能 维 持 生 命 , 但 超 过 5分 钟 不 呼 吸 空 气 , 便 会 死 亡 , 人 体 每 天 需 要 吸 入 10 12立 方 米 的 空 气 。 因 此 空 气 质 量 的 好 坏 与 人 类 的 生 存 息 息 相 关 , 评 价 空 气 的 质 量 才能 反 映 空 气 的 好 坏 , 才 能 开 展 治 理 等 工 作 。影 响 因 素 : 空气质量的好坏反映了空气污染程度,它是依据空气中污染物浓度的高低来判断
3、的。空气污染是一个复杂的现象,在特定时间和地点空气污染物浓度受到许多因素影响。来自固定和流动污染源的人为污染物排放大小是影响空气质量的最主要因素之一,其中包括车辆、船舶、飞机的尾气、工业企业生产排放、居民生活和取暖、垃圾焚烧等。城市的发展密度、地形地貌和气象等也是影响空气质量的重要因素。 1研究方法:对于空气质量的分析,各环境科研单位和研究人员都采用过很多种方法,本文主要应用dps软件作聚类分析,得到哪些城市的环保方面做的比较好,以便作为环保示范点,供其他城市借鉴学习;用spss作主成分分析对比分析各个影响参数对环境质量的影响程度,以便对国家环保局提出对大气的进一步改进。1聚类分析1.1方法基
4、本思想:基 于 所 研 究 的 样 品 或 指 标 之 间 存 在 程 度 不 同 的 相 似 性 ( 亲 疏 关 系 以 样 品 间 距 离 衡 量 ) 。 根 据 一 批 样 品 的 多 个 观 测 指 标 , 具 体 找 出 一 些 能 够 度量 样 品 或 指 标 之 间 相 似 程 度 的 统 计 量 , 以 这 些 统 计 量 为 划 分 类 型 依 据 。 把 一些 相 似 程 度 较 大 的 样 品 聚 合 为 一 类 , 把 另 外 一 些 彼 此 之 间 相 似 程 度 较 大 的 样品 又 聚 合 为 另 一 类 , 直 到 把 所 有 的 样 品 聚 合 完 毕 , 这
5、 就 是 聚 类 的 基 本 思 想 。21.2衡 量 指 标衡 量 指 标 的 选 取 对 于 聚 类 分 析 来 说 至 关 重 要 , 具 有 决 定 性 的 意 义 , 影 响 空 气质 量 好 坏 的 因 素 有 很 多 , 有 , 温 度 , 湿 度 等 等 , 为 此 本 文 选 取 了 四 个 指 标 ,分 别 是 可 吸 入 颗 粒 物 , 二 氧 化 硫 , 二 氧 化 氮 , 空 气 质 量 达 到 二 级 以 上 的 天 数。 用 以 衡 量 我 国 主 要 的 三 十 一 个 城 市 的 空 气 质 量 ,原 文 数 据 如 下 :3城 市 可吸入颗粒物 二氧化硫 二
6、氧化氮 空气质量达到及好于二 级的天数(天)北 京 0.121 0.034 0.053 285天 津 0.101 0.056 0.040 307石 家 庄 0.104 0.045 0.035 318太 原 0.106 0.075 0.022 296呼和浩特 0.074 0.049 0.040 346沈 阳 0.110 0.059 0.037 328长 春 0.085 0.034 0.043 340哈 尔 滨 0.101 0.046 0.054 311上 海 0.081 0.035 0.053 334南 京 0.100 0.035 0.048 315杭 州 0.097 0.041 0.052 3
7、27合 肥 0.111 0.023 0.027 321福 州 0.064 0.014 0.040 353南 昌 0.079 0.054 0.037 347济 南 0.123 0.050 0.025 295郑 州 0.099 0.053 0.046 322武 汉 0.105 0.044 0.054 301长 沙 0.092 0.039 0.042 333广 州 0.070 0.039 0.056 347南 宁 0.050 0.032 0.028 362海 口 0.038 0.007 0.016 365重 庆 0.105 0.053 0.037 303成 都 0.111 0.038 0.055 3
8、15贵 阳 0.074 0.058 0.026 347昆 明 0.067 0.041 0.046 365拉 萨 0.050 0.008 0.021 361西 安 0.113 0.048 0.046 304兰 州 0.150 0.059 0.043 236西 宁 0.141 0.042 0.032 280银 川 0.090 0.044 0.031 328乌鲁木齐 0.140 0.093 0.068 262该数据来源于中国统计年鉴2010 41.3数据的运算通过dps使用离差平和方法(Ward方法),计算样本的欧氏距离,样本变量按照Z得分进行标准化处理。聚类结果将31个城市分成四种空气质量类型。聚
9、类分析得到的聚类分析图谱如下所示:从聚类分析谱系图可以看出,在不同的聚类标准下,聚类的结果不同:当距离为0时,每个样本为单独的一类,即31个城市各自为一类;当距离为15.45时,31个城市被归为一类。为了将这些城市分为四类,我们取6.18为距离,这样就得出以下四类的城市:第一类:北京,哈尔滨,武汉,成都,南京,杭州,天津,重庆,沈阳,郑州,西安,太原,济南,西宁;第二类:石家庄,银川,长春,长沙,合肥,呼和浩特,南昌,贵阳,上海,广州,昆明;第三类:兰州,乌鲁木齐;第四类:福州,南宁,海口,拉萨;1.4结果分析:按照上述聚类分析的结果,可以将我国31个城市的空气类型分为四类:优,良,污染和轻度
10、污染。第一类型的城市属于污染型城市,这些城市人口密集,交通拥挤,工业发达,像北京这样的全国政治文化中心,汽车拥有量很大,汽车尾气的排放量对空气的污染十分严重,大气急需改善。第二类型的城市属于轻微污染型,这些城市的工业类型多以轻工业为主,对大气的污染较轻。第三类型的城市空气质量良好,不会影响人体的健康。第四类型的城市空气质量优,尤其是拉萨,作为我国独具特色的一个旅游城市,在发展经济的同时,特别需要将环境保护的重要性提上日程,不可再走先污染后治理的道路。2、主成分分析法2.1方法说明和模型构建:主成分分析是把原来多个变量划分为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术
11、。假设有n个地理样本,每个样本共有p个变量,这样就构成了一个np阶的地理数据矩阵(2.2.1.1)npnpxx 212112如果记原来的变量指标为x 1,x2,xp,它们的综合指标新变量指标为z 1,z2,zm,(mp),则(2.2.1.2)pmmpxllxzllxxz 2122121在 (2.2.1.2) 式中,系数l ij由下列原则来决定:(1)z i与z j(ij;i,j=1,2,m)相互无关。(2)z 1是x 1,x2,xp的一切线性组合中方差最大者;z 2是与不相关的,x 1,x2,xp的所有线性组合中方差最大者;z m是z 1,z2,zm1 都不相关的,x 1,x2,xp的一切线性
12、组合中方差最大者。2.2主成分分析数据处理相关公式(1)计算相关系数矩阵(2.2.2.1)在公式(3)中,r ij(i,j=1,2,p)为原来变量x i与x j的相关系数,其计算公式为(2.2.2.2) 因为R是实对称矩阵(即r ij=rji),所以只需计算其上三角元素或下三角元素即可。(2)计算特征值与特征向量首先解特征方程I-R=0求出特征值 i(i=1,2,p),并使其按大小顺序排列,即 1 2, p0;然后分别求出对应于特征值 i的特征向量e i(i=1,2,p)。(3)计算主成分贡献率及累计贡献率一般取累计贡献率达85-95的特征值 1, 2, m所对应的第一,第二,第m(mp)个主
13、成分。(4)计算主成分载荷(2.2.2.3)由此可以进一步计算主成分得分: (2.2.2.4) 52.3衡量指标:影响空气质量的因素有15个之多,本方法选取可吸入颗粒物(因子1),二氧化氮(因子2),二氧化硫(因子3),温度(因子4),湿度(因子5)。分别反映了影响方面:呼吸健康影响(前三个),热舒适度(温度和湿度)。数据如下:城 市 可吸入颗粒物 二氧化硫 二氧化氮 年平均气温 年平均相对湿度北 京 0.121 0.034 0.053 13.3 51天 津 0.101 0.056 0.040 12.9 58石 家 庄 0.104 0.045 0.035 14.4 57太 原 0.106 0.
14、075 0.022 11.1 54呼和浩特 0.074 0.049 0.040 8 44沈 阳 0.110 0.059 0.037 7.7 67长 春 0.085 0.034 0.043 6.1 60哈 尔 滨 0.101 0.046 0.054 5 65上 海 0.081 0.035 0.053 17.4 70南 京 0.100 0.035 0.048 16.4 72杭 州 0.097 0.041 0.052 17.8 71合 肥 0.111 0.023 0.027 16.7 73福 州 0.064 0.014 0.040 20.7 70南 昌 0.079 0.054 0.037 18.8
15、70济 南 0.123 0.050 0.025 14.8 54郑 州 0.099 0.053 0.046 15.5 61武 汉 0.105 0.044 0.054 17.9 71长 沙 0.092 0.039 0.042 18.5 72广 州 0.070 0.039 0.056 23 70南 宁 0.050 0.032 0.028 22.2 75海 口 0.038 0.007 0.016 24.3 81重 庆 0.105 0.053 0.037 19 80成 都 0.111 0.038 0.055 16.8 74贵 阳 0.074 0.058 0.026 14.9 74昆 明 0.067 0.
16、041 0.046 16.6 66拉 萨 0.050 0.008 0.021 10.3 31西 安 0.113 0.048 0.046 15.1 70兰 州 0.150 0.059 0.043 8 53西 宁 0.141 0.042 0.032 6.2 59本数据来源于中国统计年鉴2010 42.4数据的运算:2.3.1样本的标准化选取的指标具有不同的量纲和量纲单位,对选区价指标进行标准化处理,使其无量纲化,从而可以得到相同的协方差矩阵或相关矩阵。2.3.2因子spss分析根据所述原理,将标准后的样本数据输入spss软件进行主成分分析,并取特征值为大于1,得到累计贡献大于85%的主成分,结果如
17、图:解释的总方差初始特征值 提取平方和载入成份合计 方差的 % 累积 % 合计 方差的 % 累积 %1 2.356 47.119 47.119 2.356 47.119 47.1192 1.360 27.194 74.313 1.360 27.194 74.3133 .637 12.748 87.062 .637 12.748 87.0624 .402 8.043 95.1055 .245 4.895 100.000成份矩阵成份影响因素1 2 3可吸入颗粒物.813 .276 .200二氧化硫 .755 .315 .387二氧化氮 .389 .694 -.601年平均气温 -.826 .409
18、 .084年平均相对湿度-.539 .732 .281从而得到主成分方程:=0.813 +0.755 +0.389 -0.826 -0.539 ;x2 x3 x4 x5=0.276 +0.315 +0.694 +0.409 +0.732 ;x2 x3 x4 x5=0.200 +0.387 -0.601 +0.084 +0.281 ;x2 x3 x4 x5用这三个因子代替原来的5个变量可以概括全部信息的87.062%。因此,描述空气质量,可以用这三个因子,使问题更进一步简化,明了。2.3.3综合评价经过spss分析最终得出综合主成分得分(表5),它反应了各样本的综合水平成份得分系数矩阵成份影响因
19、素1 2 3可吸入颗粒物.345 .203 .313二氧化硫 .321 .232 .607二氧化氮 .165 .510 -.943年平均气温 -.351 .301 .131年平均相对湿度-.229 .538 .441在上表中可以看出:在第一主成分上,可吸入颗粒物的得分最高,这说明可吸入颗粒物成为我国主要城市空气污染的主要污染源。在第二主成分上,空气湿度的得分最高,表明湿度在一定程度上也能够影响空气的质量。在第三主成分上,二氧化硫的得分最高,这在一定程度上说明汽车尾气,工厂废气带来的危害。2.3.4分析与讨论为了使各主成分影响指标更加明显,在使用spss软件分析时要求得到正交方差旋转后的因子载荷
20、矩阵,如下表表3 正交方差旋转后的因子载荷矩阵因子1 因子2 因子3x(1) 0.3003 -0.0683 -0.1827x(2) 0.9348 -0.0481 -0.1497x(3) 0.1331 0.0693 -0.9772x(4) -0.2034 0.4192 0.0299x(5) -0.0398 0.9554 -0.0749主成分 中, , , 的系数大于其他变量的系数,因此 主要是影响人体呼x2 x3吸健康的综合指标。 代表着原有信息的47.1193,解释 为主要因子的原因是人为造成的环境空气中颗粒物,氮氧化物和硫氧化物的增加。主成分 中 ,x4 x5的系数大于其他变量的系数,因此
21、主要反映了人体热舒适度指标, 代表着原有信息27.1921%。3、结语在选择分析方法是要慎重,通常的分析方法会忽略了各指标内在的相关性,在综合评分中人为决定权数从而带有很强的主观性,一方面会掩饰各参数相互影响的情况,另一方面导致普通群众的误解。而本文选择的分析方法可以减少人为赋权产生的主观缺陷,极大地利用环境各参数的实际信息,具有很好的使用价值,为普通群众提供一个很好的参考依据。 6【参考文献】1重庆市环境保护局.空气质量受何因素影响2百度百科 http:/ 计量地理学 作者:徐建华 北京:高等教育出版社 2006.1 81996郭建辉,杨磊,程新宝.上海市环境空气质量影响参数主成分分析.中国科技信息2005年第15期