1、1论文题目:城市空气质量评估及预测目录一、 摘要 1二、 问题的提出 2三、 问题的分析 2四、 模型的建立 41) 问题一 41. 模型假设 42. 定义符号说明 53. 模型建立 54. 模型求解 65. 模型的评价与推广 72) 问题二 8 模型假设 8 模型建立 8 模型求解 12 模型的评价与推广 14) 问题三 15 模型假设 15 定义符号说明 15 模型建立 15 模型求解与分析 16 模型的评价与推广 18五、 参考文献 20六、 附录 212城市空气质量评估及预测一、摘 要本文对我国城市的空气污染程度、成都未来空气质量、城市空气污染的主要因素进行了分析研究。针对我国现行的空
2、气质量评估标准API 分级制中的不足,在 API 评估基础上进行修改完善使之更加科学,并在 API 所提供的数据基础上对成都今年十一月份的空气质量进行预测,最后还收集了必要的数据来研究影响城市空气污染程度的主要因素。本文对三个问题的研究分别建立了相应的数学模型。城市污染程度的科学评估,由于城市空气污染会对人们的健康造成重大危害,所以在评价一个城市的空气污染程度时必须重点考虑污染严重的天数,所以本文对模型采用权重系数法,以各城市每天的 API 指数值为基础,权重系数随污染等级的增大而加大,扩大重污染严重天数对城市污染程度的影响,这样的评估更合理更科学。另外本文考虑到空气污染程度的季节性变化,所以
3、最后利用 Excel 对数据进行处理和计算,得出十个城市污染程度的季度与年度的综合排名。空气质量预测模型基于附表中近几年来成都秋季空气质量相关数据,先预测出今年秋季的综合数据,再预测出 11 月份的空气质量数据。空气质量的变化与季度存在一定的关系,而相邻年度的同一季节内各个等级出现的天数差异不大,并存在一定规律,一个月份的预测则没有一个季度预测更加准确。所以我们先将每年秋季各相关数据求出,然后利用最小二乘法对数据进行拟合,略去其中偏差较远的数据,再用 Matlab 软件求解拟合曲线方程,根据所得的函数方程式预测 2010 年 11 月份空气质量,并将结果整数化,就得到 11 月份各等级质量出现
4、的天数及其平均 API 指数值。影响城市空气污染程度的主要因素建立于网上所查的国家颁布的数据之上,总的来说,大气污染源主要可分为自然源和人为源两大类。人为源包括车辆、船舶、飞机的尾气、工业企业生产排放、居民生活和取暖、垃圾焚烧等。城市的发展密度、地形地貌和气象等也是影响空气质量的重要因素。城市空气质量的好坏与季节及气象条件的关系十分密切。因此我们分不同地区及不同季节讨论。将某种污染源的所有污染物的等标污染负荷按数值大小排列,从小到大分别计算百分比和累计百分比,将累计百分比大于 80%的污染物确定为该污染源的主要污染物污染源,即影响城市空气质量的主要因素。3关键词: 空气污染物; API;权重系
5、数法;季度与年度排名;最小二乘法;等标污染负荷比4二、问题的提出2.1 背景介绍环境质量是环境对人类社会生存和发展的适宜性。人类和地球上的所有生物,在长期的进化中,与环境形成了一种互相作用和相互依存的平衡关系。但是,人类的活动,尤其是自工业革命以来的工业化生产,城市规模扩大和人口的急剧增加剧烈地改变了环境的结构和功能。尤其是在城市集中了大量的工厂、车辆、人口,空气质量因为车辆、船舶的尾气,工业企业生产排放,居民生活和取暖,垃圾焚烧等原因,逐渐开始恶化。温室效应,大气污染,臭氧空洞,森林锐减,酸雨蔓延,土地荒漠化,水质污染,生物多样化和遗传多样性减少,气候现象变化异常环境问题已经成为当今世界各国
6、普遍关注的问题之一,也是 21 世纪人类面临的重大挑战。空气污染威胁着人类的日常生活,空气中极其微少的污染物,都能对人体健康产生极大的影响,导致各种疾病的发生甚至夺取人们的生命。在工业发达国家中的大城市就多次发生大气污染公害事件,数以万计的人致病或丧生,严重危害了人体健康和生态平衡。例如:1952 年 12 月份的伦敦烟雾事件,夺去了四千多人的生命;1955 年以后,日本四日市被硫酸雾笼罩。1964 年,该市市民哮喘病大发作,有人因哮喘病发作而死。我国是一个人口大国,城市众多,但由于工业的发展,我们的很多城市都受到了不同程度的污染尤其是空气污染,直接对我们造成伤害。近年来,虽然我国大气污染防治
7、工作取得了很大的成效,但由于各种原因,我国大气环境面临的形势仍然非常严峻。要实现大气环境与社会经济协调发展,开展城市环境空气质量影响因素及其影响机制的研究是十分必要的,也是改善城市环境质量迫切需要解决的实际问题。我们统计不同城市不同数据,运用数学建模方法可以对不同城市的综合空气质量进行统计和比较。2.2 需要解决的问题1)从中国的实际情况的特点出发,利用附件中的相关数据(以及相关文献和有关补充数据) ,建立数学模型给出十个城市空气污染严重程度的科学排名;2)建立模型对成都市 11 月的空气质量状况进行预测;3) 收集必要的数据,建立模型分析影响城市空气污染程度的主要因素;4) 评价所建立的数学
8、模型中的优点和存在的不足。三、问题的分析3.1.1 城市空气质量评估排名分析评价城市空气污染程度主要考虑其对人体的危害程度。大气中的污染物有多种,并以二氧化硫、二氧化氮、可吸入颗粒物三者居多,评价一个城市一天的空气质量指数(API)便是只考虑它们三者对人体的危害。API 指数是通过首要污染物的浓度换算过来的,所以用 API 指数值来评价城市一天的空气质量是比较科学的(其不科学性在模型分析中再做说明)。但如果用 API 来评价一个城市的长期污染程度的话,显得不是那么科学,尽管“十一五” “创模”考核指标依据“API 指数”100 的天数占全年天数的比例,但此法只是为了利于全国的城市质量管理,并不
9、能作为长期的空气质量管理。所以我们采用权重系数法5来建立此模型。又考虑到空气污染程度与季节有明显的关系,因此我们又分别建立季度与年度的污染程度模型。3.1.2 城市空气质量评估排名相关概念及其说明(1) 每天污染指数:它是表示日常空气质量的一种指数,就是将每天监测的几种空气污染物浓度简化成为单一的概念指数值形式,告诉人们吸入污染的空气后的健康损害。(2) 污染指数段:它是根据污染指数等级划分标准所确定的五个段。(3) 权重系数:由于污染指数段的不同,不同段的污染指数对空气质量的影响及健康的影响不同,所以每一段对空气质量的影响都有一个影响系数,我们称之为权重系数。 各段权重系数= 等 级 数 总
10、 和各 段 等 级 数(4)季度污染程度数:它是根据一各季度内个等级中的每天的污染指数加权重计算得出,用来评价一个季度的空气质量。计算公式为:所 取 季 度 天 数天 的 污 染 指 数等 级 第第等 级 权 重 系 数第季 度 污 染 程 度 n1j5i ji(5)年度污染程度数:它是根据一年度所取月份的各等级的污染指数加权重计算得出,用来评价该城市的空气质量。其计算公式为:所 取 年 度 天 数天 的 污 染 指 数等 级 第第等 级 权 重 系 数第年 度 污 染 程 度 n1j5i ji3.2.1 预测 11 月空气质量变化趋势的相关分析尝试运用短期气候趋势预报的原理和经验与短期空气质
11、量预报相结合的方法对成都 2010 年 11 月的空气质量进行预测分析。即在 2010 年 11 月份气候预测的基础上,通过统计分析与 11 月份的相似年份的分析污染气象条件,确定污染潜势和气象参数然后运用 2009 年度分析的 10 月份特定污染潜势条件下的空气污染统计参数和污染物浓度预报方程,计算详相似年份中 10 月的逐日的空气污染物(SO 2,NO2,PM10)的浓度,并根据空气质量标准,进行日空气质量等级划分。最终综合 2010 年 11 月气候特征预测分析相似年的日空气质量计算结果和分析,做出 10 月份的空气污染日数的预测,最终得到 10 月空气污染预测。 【1】3.2.2 成都
12、市 11 月空气污染预测模型的相关说明(1)利用 2010 年 1 至 10 月份数据和近几年的空气质量气象报告资料做出全面空气质量预报;(2)在短期气候预报的基础上利用相似年份确立污染气象条件及短期预报所需要的气象参数;(3)使用短期空气质量统计预报方程计算各个相似年份追日污染物的浓度预报值,确定日空气质量级别。根据日空气质量级别,做出月污染物预报;(4)综合分析月空气质量趋势预测结果,根据以往空气污染的经验最终做出610 月份的空气质量预测;(5)进行空气质量预报的检验,进行误差预报分析并提出未来需要改进的方法。3.3.1 影响城市空气污染程度的因素分析【2】大气污染源主要可分为自然源和人
13、为源两大类。自然源包括风吹扬尘,火山爆发产生的气体与尘粒闪电产生的气体,如臭氧和氮氧化合物,植物与动物腐烂产生的臭气,森林火灾造成的烟气与灰尘,自然放射源和其他产生有害物质并向大气排放的源。但在维持正常的生态平衡条件下,他们一般并不恶化空气,人们也无法有效地控制他们。人为源是形成大气污染问题,尤其是局地空气污染的主要原因。他们是从人们的生活生产过程中产生的。主要有工业的污染源,交通运输污染源,居民生产源。来自固定和流动污染源的人为污染物排放大小是影响空气质量的最主要因素之一,其中包括车辆、船舶、飞机的尾气、工业企业生产排放、居民生活和取暖、垃圾焚烧等。城市的发展密度、地形地貌和气象等也是影响空
14、气质量的重要因素。 调查城市空气污染的主要因素首要是清楚城市背景污染的来源与城市和大气的自净能力,分析和估计它们对评价区大气环境的影响程度,确定影响评价区大气环境质量的主要污染源和主要污染物。探讨自净过程和污染扩散的分析。(1)调查范围 空气污染源调查范围一般应与评价范围相同,但应考虑界外区域污染源对城市空气质量的影响。在污染源调查时,应包括界外区域排气筒高和排放量大的点源。界外区域的边长大致为城市范围边长的 0.5 倍。(2)调查的内容和方法 污染源排放量大,毒性强者污染原本调查的重点。污染源调查中,应根据评价项目的特点和当地的大气污染状况筛选调查的污染因子。通过收集必要的资料,必要时进行时
15、测核实等方法进行污染源调查。收集和调查的内容如下:工业的污染源名称、位置、高度、烟气出口内径、出口气体速度、运行期烟 1气排放量、主要污染物及其排放量、主要污染物及其排放量等。交通运输污染源。燃料构成、来源、成分、供应方式和燃料消耗情况等情况。 2居民生产源。燃料成分、来源、成分、供应方式和燃料消耗等情况。同时不 3同时间,不同季节燃料消耗量不同。四、模型的建立4.1 空气质量评估模型4.1.1 基本假设1)考虑季节的影响,分季节排名和综合排名;2)不考虑前一天数据对后一天的影响;3)在数据统计期间,没有额外的大型工厂突然建立或发生大面积的火灾;4)忽略附录所给三种污染物之外的污染物对空气质量
16、的影响;5)假设三种首要污染物的 API 指数相同时,城市空气质量一样;76)首要污染物的污染指数即为空气污染指数;7)附件中的数据为我国 10 各主要城市城市空气质量的日测数据,数据具有权威性,值得相信,具有使用价值。8)不考虑空气污染物的扩散对城市空气质量的影响;9) 计算春季与冬季时,忽略秋季缺少的 11 月与冬季所缺少的 12 月对季度空气污染评估的影响。4.1.2 定义符号说明C 表示一个时间段(季度或年)的污染程度iI表示第 i 等级在改时间段的污染程度和n 表示该时间段的总天数ijI为第 i 季度第 j 等级污染指数总和ijh为该季度该等级每天的污染指数t 为第 i 段的污染指数
17、在一个季度内出现的次数Z1 春季 Z3 秋季Z2 夏季 Z4 冬季4.1.3 模型的建立在评估一个城市的空气质量之前,我们要考虑的首要因素应该是该地区的空气质量是否对人们的健康造成损害,污染物浓度越大,对人们的危害也越大,从而在设定个阶段的权重系数时,随着污染等级的增加,所对应的权重系数也越大,并且取其与等级成线性关系的权重。其次在污染指数没达到危害值之前,这样的污染对环境也有可能存在潜在的危害,另外还应该排除一些特殊的情况,所以建立的评估模型既不能忽视污染严重的情况,也不能过分放大这些特殊情况;既不能忽视污染相对较小的情况,也不能让这些情况过大影响污染程度的确定。所以评估时建立如下模型,即:
18、C= nKIinii1对上述的模型求解,我们先计算出一个季度的一个等级的污染程度和,再计算一个的内的空气污染程度数,比较各季度的污染程度,由于并没有每个季度的全部数据(如秋季的 11 月与冬季的 12 月) ,所以在计算全年的污染程度时采用对全年数据的整体计算,而不是求每个季度的平均值。附件中给出了各个城市每天的空气污染指数,并且还给出了各个城市每天的空气质量等级,所以利用 Excel 软件可以很方便快捷地计算出每个城市各个一个季度的一个等级的污染程度和。然后可以按不同的时间段,比如按季节或按年,评估出所有城市的空气污染程度,最后列出不同时间段的所有城市空气污染严重程度的科学排名。4.1.3.
19、1 城市空气污染一个时期内的污染程度和由于城市的空气污染会对人们的健康造成损害,所以严重的空气污染出现8的频率不能太高,以每个季度的每个等级的每天作为一个计算基础,计算出该季度的该等级的污染程度和:thijijI14.1.3.2 城市空气污染严重程度季度及年度评估的评定模型在已知各个城市每天的污染指数和每天的空气质量等级的前提之下,综合考虑各个方面的因素,利用已经求得的每个季度的每个等级的污染程度和,综合评估一个地区长期的空气污染严重程度。所以有以下的模型(模型一:季度模型):=iCnKIiij51(i=1,2,3,4,5)5i在以上的数学模型中:表示一个季度的污染程度;iCn 表示所取季度的
20、总天数;因为每个季度污染程度数据的平均值并不能准确反映年度的污染程度,所以用类似于求季度的污染程度的方法求来年度的污染程度。 (模型二:年度模型):C= nKIinii1)5,432(ii其中:表示一个年度内的第 i 等级污染程度和;iIN 表示所取年度内数据的总天数4.1.4 模型的求解观察附表所给的数据集查阅相关的资料,得知空气污染与季度有着很密切的关系,因此我们在比较全年度污染程度的同时,也分季度来计算各城市的污染程度排名,这样有利于我们全方位地判断各城市的污染程度。由于附表的所给城市的数据有些是从 1 月 4 日开始,而有些从 1 月 1 日开始,所以在求得的某个等级的污染程度和,再乘
21、以相应的权重系数后,再除以所取数据的全部天数,这样才能更为准地表示一个季度或年度的空气污染程度。表 1-1 是我们的算法求出的各城市各季度及全年的污染程度数。污染程度 城市 成都 杭州 北京 上海 广州第 1 季度 16.083 7.634 11.259 7.48 7.2169第 2 季度 10.265 7.66 11.85 9.02 6.467第 3 季度 7.926 9.78 16.13 5.695 6.267第 4 季度 8.68 11.62 11.68 5.002 8.336总体 10.36 9.01 12.82 6.898 6.899污染程度 城市 拉萨 乌鲁木齐 郑州 武汉 西安第
22、 1 季度 2.36 28.41 12.04 9.293 14.69第 2 季度 2.67 11.53 9.94 7.41 14.77第 3 季度 7.346 8.826 13.78 11.9 9.8第 4 季度 7.053 11.86 12.405 13.22 12.32总体 4.81 13.113 11.976 10.244 12.7表 1-1从上图中我们可以很快地求得各城市的各季度及年度污染程度从低到高的的排名,如表 1-2 所示:排名 第一季度 第二季度 第三季度 第四季度 综合排名1 拉萨 拉萨 上海 上海 拉萨2 广州 广州 广州 拉萨 上海3 上海 武汉 拉萨 广州 广州4 杭州
23、 杭州 成都 成都 杭州5 武汉 上海 乌鲁木齐 杭州 武汉6 北京 郑州 杭州 北京 成都7 郑州 成都 西安 乌鲁木齐 郑州8 西安 乌鲁木齐 武汉 西安 西安9 成都 北京 郑州 郑州 北京10 乌鲁木齐 西安 北京 武汉 乌鲁木齐表 1-24.1.5 模型的评价与推广4.1.5.1 模型的不足由于我们对各城市的污染排名模型是基于附表所给 API 指数而建立的,而API 指数的算法只取了三种污染物中污染程度最大的一项,若其它两者的污染程度也接近于最大的那一项,则该天的 API 指数便不能准确地反映真实污染程度。尤其是我们可以发现,大多数情况下,首要污染物是可吸入颗粒物,从而在以二氧化硫或
24、二氧化氮为首要污染物时,可吸入固体颗粒物任然存在,确切说是误差相对比较大,因为可吸入固体颗粒物主要是靠自身重力作用沉降而净化,所需时间比较长,在短时间(几天)内变化不大,从而在二氧化硫、二氧化氮为首要污染物出现比较多的城市中,此评价模型得出的结果与实际污染程度可能会稍有差异。4.1.5.2 结果的分析与检验考虑季节的影响和地域不同。我们分别从不同城市的不同季节和年度的排名分析.通过函数的计算与统计(由于城市 11 月份及 12 月份数据不全,所以在计算时将它们忽略)可以清楚得出 10 个城市综合空气质量污染程度排序(一级天数排名见【附录】 ) ,结果如下:(1)拉萨10(2)上海(3)广州(4
25、)杭州(5)武汉(6)成都(7)郑州(8)西安(9)北京(10)乌鲁木齐这个模型可以从另一个侧面反映了所给的原始数据所代表的实际情况,适用于对某个城市的中长期评价,具有较高的科学性。结论显示乌鲁木齐综合的空气污染程度最严重,北京次之,拉萨最好。但对于不同季节略有差异。乌鲁木齐地处新疆,能源丰富,但周边绿化程度低,风速对环境影响大,沙尘天气多。查阅资料得知:乌鲁木齐各月均有出现沙尘天气的可能,所以综合排名很低,特别集中在春季 3 至 5 月份,与我们所得的数据恰好吻合,也体现了所用方法的合理性。对于北京从实际出发,我们可以找到一点答案。北京是中国的首都,是人口积聚的中心。人口密集,交通拥挤,工业
26、生产规模越来越大,能留物流越来越集中的综合性工业城市,地处北方,铁路交通枢纽,同时冬季取暖,主要能源使用煤炭,煤炭排放的污染物占燃烧的大部分,对空气污染较严重,同时能源材料利用率较低。经济正处于飞速发展阶段使得空气污染日剧加重。政府应该采取一些措施来治理空气污染。 拉萨最好,主要因为人口较少,工业体系不完备,资源较少,绿化程度高。可以得出这个模型有正确的地方。同时与往年权威数据作比较(来自于中国气象数据中心结果可靠) ,与往年名次基本接近,略有变化,且此方法所用的季度排名具有很大的优势,例如拉萨在此十个城市中的中很明显地高于其他九个城市,但拉萨在秋冬季度的排名还是低于上海。也体现了按季度排名的
27、优越性,只按年度排名是看不出这些细微的差别的。今年的上海与广州的污染程度相差无几(上海略低于于广州) ,而查得的数据显示去年广州的空气污染程度低于上海,此间可能因上海要召开世博会,采取了多方面的综合治理和临时措施,空气中的主要污染物浓度均出现较大幅度的下降,上海地区的环境空气质量有了明显的好转。此外我们所采用的方法淡化了空气质量为优级别的污染程度权重,加大了污染程度大的权重,而城市“城考”及“创模”强调的就是空气质量达优的天数,所以我们的方法求得的各城市的排名与网上排名稍有差异。 “城考”及“创模”主要的目的在于管理城市空气质量,但较为粗略,我们的方法则较为精确地反映了各城市的污染程度。由于我
28、们模型的建立时在秋冬两季各缺了一个月的数据,所以在秋冬两季的污染程度可能会有些偏差与不足。4.2 成都市 11 月的空气质量预测模型4.2.1 基本假设1)成都周边风速较小,扩散较慢,忽略周围城市污染物的扩散对成都市的影响;112)在预测月份中,气候未出现大的异常;3)与相似年份的数据基本吻合,未出现大规模变化,污染潜势和气象参数基本一样;4)相似年份的数据来源可靠,具有使用价值;5) 成都市的车辆未出现大幅增加或减少,大范围工厂兴建和拆毁;6)空气质量的原始数据并不一定完全相同,但为了简化问题,计算所得出来的数据只要是同一级别,如 35 和 47 一样,无区别;7)预测成都 11 月份的空气
29、质量时,忽略特殊年份的特殊数据,假设其对结果无影响;8)成都在相似年份并没有出现中度、重度污染,故忽略这两种情况,得出数据无效。4.2.2 模型的建立4.2.2.1 由于空气质量的高低一般和年份、临近月份存在关系,而且会因为季节的不同而不同,比如 2005、2006 等年份的空气质量大体相同但也存在联系,再比如有些地区的冬季和春季的空气质量也存在差异。研究某地区未来空气质量可以借助以前已有的数据,利用最小二乘法对数据进行拟合,最后用 Matlab 软件求解拟合曲线方程。其次在分析数据时为了避免数据太少对预测结果造成偶然误差,在预测某一月的空气质量时可以将其相似月份一起分析。在分析往年数据时发现
30、规律,有如下数据统计:编号 污染指数平均数 1 21 78.1 10 67 13 12 79.0 10 69 11 13 79.2 12 69 10 04 69.1 14 72 5 05 81.3 15 65 9 2其中:第一列编号 1,2,3,4,5 分别代表 2005,2006,2007,2008,2009;第二列数值表示九月十月十一月污染指数的平均值;第三列数值表示空气质量优的天数;第三列数值表示空气质量良的天数;第四列表示空气轻微污染的天数;第五列数值表示空气轻度污染的天数。污 染 指 数 平 均 数68.070.072.074.076.078.080.082.00 1 2 3 4 5
31、 6系 列 112从这些散点图可以看出除了第四个点的分布比较特殊外,其它四个点的分布还是比较有规律的,可以看出这四个点基本呈线性分布。一 等 级 出 现 次 数02468101214160 1 2 3 4 5 6系 列 1从一等级出现次数我们可以看出这些散点图除第一个点之外,其余四点的分布还是很有规律的,这四个点呈抛物线态分布。从二等级出现次数的散点图来看,除了第四个点之外,其它四点的分布还是很有规律的,这四点呈开口向下的抛物线分布。二 等 级 出 现 次 数646566676869707172730 1 2 3 4 5 6系 列 1三 1等 级 出 现 次 数024681012140 1 2
32、 3 4 5 6系 列 113从三 1 等级出现次数的散点图可以看出除了第四个点外,其余四点的分布有规律,基本呈开口向上的抛物线。再来单独考虑空气质量等级为三 2 的情况,由于成都以往的数据中这三个月之中出现三 2 等级的次数很少,所以可以先不考虑。4.2.3.2 曲线拟合的最小二乘法方法介绍 多项式数据拟合【3】由于预测成都十一月份的空气质量是借助于以往的数据,分析反映空气质量的各种指标的分布规律,又因为往年数据有限,所以给预测带来了困难,这不仅是发现其规律有困难,还会使预测结果产生很大的误差,一旦方法选择不好,误差就可能严重偏离实际。为此,类如插值法求解方程,待定系数法求解方程等方法就不适
33、和本题,插值法对外插的值收敛性要求比较高,而且外插的值误差也较大;待定系数法必须先发现公式然后求解,显然不符合本模型。所以对于预测成都十一月份的空气质量还是选用最小二乘法,有两个优点,其一,最小二乘法求出的结果误差小,可以最大程度上拟合这些点,其二,最小二乘法的求解可以利用 Matlab 等软件求解。下面为最小二乘法的原理:首先可以在 Matlab 或其它画图软件中描出散点图,观察散点图的分布特征选择合适的多项式,如设用一个 m 次多项式来拟合一组数据( )(i=1,2,,n)。但拟合出来的直线存在一定的偏差,由散点图可以看出影响空气质量的几种参数随时间的分布并不规律,而且由于某些特殊的点还要
34、舍去,所以分析偏差很重要。因而可以如下进行偏差的分析:在节点 处, 的偏差设为最少二乘法的基本思想是对所有数据点,拟合函数式的偏差 的平方和取最小值。由于( )为已知,故将 视作 的系数 (j=0,1,m)的函数。不同的拟合多项式,有不同的一组系数 (j=0,1,m),因而有不同14的 值即于是上述拟合问题便归结为求求多元函数的极值问题,欲使取最小值,则 必须满足条件(k=1,2,,m)经过上面的方法处理之后可以得出使偏差最小的表达式,令则式可以表达成为(k=1,2,,m)这是一个 m+1 阶对称的线性方程组,成为正规方程组,具体写出来就是此方程组的系数行列式不为零,故它有唯一解。将系数 代入
35、式中即可得到所要求的拟合多项式。此方法相对于传统方法处理现有的数据可以大大减少误差,从而使预测更加准确。求出的拟合曲线适用于靠近的点,因为经过分析在前后小范围内收敛的很好,所以因为求出的结果为整个第三季度的数据,所以最终的 11 月份预测各项数据为求出的季度数据减去 9、10 月份的相关数据。公式为: 九 、 十十 一 yyP其中: 表示 2010 年十一月份的相关数据;P 为最小二乘法算出的数据;十 一y15为 2010 年九、十月份的综合数据。九 、 十y4.2.3 模型的求解预测未来城市的空气质量可以建立在以往的数据基础之上,因为根据对往年的数据分析,可以发现些规律,所以在假设今年成都十
36、一月份的空气质量不会发生特殊的变化的情况下,可以采用数值分析对现有数据进行研究,找出这些数值之间的关系,用来预测成都一个月份的空气质量。但通过数据的研究发现,但个月的数据分布规律并不好,原因可能是数据量太小,所以偶然因素特别大。进而通过查阅专业书籍【4】知道一个季度的空气质量具有相似性,为了更精确的预测成都十一月份的空气,可以先将九月十月十一月份的空气质量情况综合考虑,在得到今年秋季的空气质量总体情况后,继续求解就能得到更精确更科学的预测结果。根据对附件中的 2005、2006、2007、2008、2009 年的数据的九月十月十一月的污染指数的统计可以得到五个预测指标,污染指数平均数,、1、2
37、 等级出现的天数。但在一组数据中存在某些病态的数据点,根据数值分析的知识去掉这些点并不影响最后的预测。下面就根据这些思路借助 Matlab 软件求解拟合曲线方程,并用此公式预测 10 年成都的空气质量。编号 1 2 3 5污染指数平均数 78.1 79 79.2 81.3根据这些数据拟合出方程为: 0.71.8473Px污 染 指 数 平 均 值 9污 染 指 数 平 均 值编号 2 3 4 5等级出现的天数 10 12 14 15根据这些数据拟合出方程为: 05.45.325.0xxP一 等 级71一 等 级编号 1 2 3 5等级出现的天数 67 69 69 65根据这些数据拟合出方程:
38、7091.63182.472.0xxP二 等 级 6二 等 级16编号 1 2 3 51 等级出现的天数 13 11 10 9根据这些数据拟合出方程: 290.1568.27.01 xxP等 级三 39等 级三编号 1 2 3 4 52 等级出现的天数 1 1 0 0 2分析这些数据完全可以推断出这种空气污染程度在成都一个季度只会出现一次左右,所以完全可以推测: 12等 级三P其中:x 表示编号,而 2010 年的编号为 6。说明:对成都市的十一月份的空气质量进行预测完全没有必要研究四、五等级的空气质量,因为通过观察往年数据这些空气质量不会出现在成都的秋季。数据的修正用最小二乘法拟合出的曲线本
39、身就存在在误差,而且需要用拟合曲线求数据区间之外的数值,所以误差更大;利用类似于求 Lagrange 插值法误差分析的方法矫正已得到的数据;再其次预测本身的误差就比较大且各年份的值变化不大比较平稳,还有很多想不到的意外因素都有可能对预测产生影响,所以将已求的结果进行合理的整数化,完全在误差的的允许范围内。所以已有某些数据可改为: 17一 等 级P63二 等 级 01等 级三由附件中的数据可以直接得出评估九月十月的空气质量的各种数据,有以下数据表:九、十月份空气质量相关值平均值 等级天数 等级天数 1 等级天数 2 等级天数68.47541 15 44 2 0所以可用这些数据或上面的公式计算出成
40、都十一月份的空气质量预测:成都市十一月份空气质量状况预测17污染指数平均值等级出现天数等级出现天数1 等级出现天数2 等级出现天数108.19 2 19 8 14.2.4 预测模型的评价与推广基于以往数据的预测具有一定的准确性,只要当年不发生某些特殊的事件,通过近几年的数据得出的数学模型就在一定程度上适合今年。最小二乘法拟合出的曲线还是能最大程度上反映数据的基本规律。另外在选择数据时采用分季节收集,这样可以减小误差和减小偶然误差,增加数据的稳定性。空气质量的长期预测难度大,因为影响空气质量的因素太多,有些以现在的科学技术水平根本无法预测,所以现在存在的准确的最多的就是短期的空气质量预测方法,但
41、在人类生产生活中长期预测空气质量还是很有必要的。比如环保部门可以有针对性的建立长期环境保护措施防止空气污染的出现;长期的空气质量预测也可以为人们旅游度假地的选择提供依据等。 【5】根据模型预测出来的结果大体符合成都市的现状,首先今年成都经济社会飞速发展,各类工厂增多,机动车数量猛增,而且各类土木建设增多等这些现状导致成都市今年的十一月份空气质量相对于往年较差,但基本上符合这几年的递增规律。而且根据十一月份初的空气质量状况成都市连续三天的轻微污染在一定程度上验证了本文预测模型的准确性。预测模型的主要不足4.2.4.1 效用评价函数【4】预报准确率=对我国主要城市空气质量的聚类分析和判别分析 摘要
42、本文应用多元统计分析中聚类分析和判别分析的理论,使用SPSS17.0 软件和 spss13.0 对我国主要城市的空气质量进行了聚类分析,将 31 个城市按照空气质量的类型分为了四类。在此基础上,对这些城市的空气质量归属进行了回报判别,结果令人满意。18关键词 :spss,聚类分析,判别分析,回报判别,空气质量类型Abstract:According to the theory of Cluster Analysis and Return Discrimination in the book of Multivariate Statistical Analysis and according to the software of SPSS1