收藏 分享(赏)

2011数学建模A题神经网络优秀论文,带代码.pdf

上传人:精品资料 文档编号:9698219 上传时间:2019-08-26 格式:PDF 页数:24 大小:854.48KB
下载 相关 举报
2011数学建模A题神经网络优秀论文,带代码.pdf_第1页
第1页 / 共24页
2011数学建模A题神经网络优秀论文,带代码.pdf_第2页
第2页 / 共24页
2011数学建模A题神经网络优秀论文,带代码.pdf_第3页
第3页 / 共24页
2011数学建模A题神经网络优秀论文,带代码.pdf_第4页
第4页 / 共24页
2011数学建模A题神经网络优秀论文,带代码.pdf_第5页
第5页 / 共24页
点击查看更多>>
资源描述

1、 1 城市表 层土壤 重金属 污染 分析 摘要 本 文 给 出 重 金 属 浓 度 空 间 分 布 、 各 区 域 污 染 程 度 和 污 染 原 因 , 建 立 神 经 网 络模型用遗传算法求解污染源位置, 再将模型拓展以期得到地质环境演变模式。 问 题 一 : 通 过 八 种 重 金 属 浓度的 等 值 线 图 来 描 述 其 空 间 分 布 , 利 用 污 染 程 度指数来衡量不同功能区的污染程度。 以 八 种 重 金 属 在 各 采 样 点 的 浓 度 为 初 始 数 据 , 利 用 三 角 形 线 性 插 值 法 ,运 用 matlab 编程得到八种重金属浓度值在空间上的分布,并绘制

2、成等值线图,得 到了八种重金属的空间分布特点。 同时, 我们利用污染程度指数作为指标来衡量 不同功能区的污染程度 ,得到结论 :污染程度从高到低依次是工业区、交通区、 公园绿地区、生活区 、山区。 问题二:通过相关分析和关联规则分析来确定重金属污染的主要原因。 我 们 运 用 spss 软件 在 显 著 性 水 平 0.01 的 情 况 下 对 八 种 金 属 浓 度 进 行 person 相关 分 析 , 并对 不 同 金 属之 间 的 相 关性 进 行 双 侧检 验 , 结 果发 现 :重金 属 Cu、Cr、Ni 具有显著的相关性,其中 Cr、Ni 的相关性极其显著;重金属 Pb 与Cd、

3、Pb 与Cu、Zn 与Pb 有显著的 相关性。 我们再利用SAS 进行关联规则分析 , 其中将功能区作为前项, 土壤表层是否收到重金属污染作 为后项, 根据所得可信 度分析出: 所有重金属污染都 主要来源于工业废水废渣, 另外 As 和Cr 污染还来 源于生活垃圾,Pb 污染还来源于汽车尾气的排放。 问题三:建立神经网络模型,用遗传算法确定污染源的位置。 为了确定污染源的位置,我们建立了基于matlab平台的BP 人工神经网络模 型。 结果表明该模型能准确反映重金属污染物的传播特征并得出重金属浓度的空 间分布。然后利用 遗传算法搜索到 污染源的位置。求解结果如下表: 综合分析所得污染源 所 在

4、 位 置 ,发现不同金 属 的 污 染 源有同源现象 , 依据 同源性汇聚污染源 ,绘制了八种重金属的污染源 汇总图。 问题四: 神 经 网 络 模 型 的 优 点 是 具 有 较 强 的 自 组 织 、 自 学 习 能 力 、 泛 化 能 力和充分利用了海拔 高度的信息 ; 缺点是训练要求样本点容量较大 。 可以通过搜 集前几年该城区八种重金属浓度的采样数据和近几年工厂分布多少位置的变化、 交通路段车流量的变化、 人口及生活区分布变化 与植被分布多少位置的变化等数 据,进一步拓展神经网络模型,得 到该城市地质环境的演变模式 。 关键词: 三 角形线性插值 相关分析 关联规则 神经网络 遗传算

5、法 As Cd Cr Cu Hg Ni Pb Zn (1200,3006) (2105,2593) (3487,5325) (2101,3390) (2643,2875) (3211,5686) (1991,3329) (1699,2867) (18508,10206) (4753,10875) (3198,5822) (13868,2354) (24001,12366) (4508,5412) (3725,5487) (27680,12111) (17450,3825) (15243,9186) (9583,4512) (21301,11467) (13653,9655) 2 随着城市经济的

6、快速发展和 城市人口的不断增加, 研究人类活动影响下城市 地质环境的演变模式,日益成为人们关注的焦点。 不同的区域环境受人类活动影响的程度不同, 按照功能划分, 城区一般可分 为生活区、 工业区、 山区、 主干道路区及公园绿地区, 现对某城市城区土壤地 质 环境进行调查。 将所考察的城区划分为间距 1 公里左右的网格子区域, 按照每平 方公里 1 个 采样点对表层土(010 厘米深度)进行取样、编号,并用 GPS 记录 采样点的位置、 海拔高度及其所属功能区等信息。 分析获得了每个样本所含的多 种化学元素的浓度数据。 另一方面, 按照 2 公里的间距在那些远离人群及工业活 动的自然区取样,将其

7、作为该城区表层土壤中元素的背景值。 我们需要解决如下问题: (1) 给出八种主要重金属元素在该城区的空间分布 图,并 建立指标来分析该 城区内不同区域重金属的污染程度。 (2) 对数据进行挖掘,分析出 重金属污染的主要原因。 (3) 分析重金属污染物的传播特征, 由此建立模型, 从而确定污染源的位置。 (4) 分析所建立模型的优缺点, 收集更多的信息, 通过这些信息建立模型来 研究城市地质环境的演变模式 。 符号 意义 k 表示不同功能区 i 表示金属的种类 j 表示不同的样本 ij x i x 表示样本 j 中金属i 的浓度 表示金属i 背景值的平均值 i 表示金属i 背景值的标准差 ij

8、Y 表示 ij x 标准化后的值 i k I 表示金属i 的权重系数 区域 k 的污染程度指数 3 假设 样本值真实可信。 假设重金属浓度 随空间是 连续变化的。 图 1 该城区 的地形分布图 首 先 , 我们根 据 样 本点的 位 置 和海拔 绘 制 出该城 区 的 地貌, 见 图 1。我 们 运 用 matlab 软件,根据各个网格区域中的重金属含量,用三角形线性插值的方法 得到各种重金属含量在空间上分布的等值线图。 图 2-1 图 2-2 图 2-1 给出 了 As 在该 区域的空间分布: 图中可以观察到 As 有两 个明显的高 值中心, 我们标记为区域1 和 2。 这两个区域都处于工业

9、区分布范围内 , 并以该 两个区域作为中心向外延伸, 浓度逐渐减少, 同时我们注意到 在山区的很多区域 1 2 1 2 4 浓度都在背景值之下。 图2-2 给出了Cd 在该区域的空间分布: 同样 我们也可以在该图中观察到两个 明显的高值中心区域 1 和2, 这两个高值中心的地理位置和图 2-1 中高值中心的 地理位置很相近, 说明金属As 和Cd 在该城区的空间上的分布很相近。 同时从图 中我们还可以看到在整个城区内 Cd 的浓度普遍较大, 而且很多区域内 Cd 的浓度 都远超过背景值的最大浓度。 图 2-3 图 2-4 图 2-3 和图 2-4 分别给出了 Cr 和 Cu 在该区域的空间分布

10、:显然,我们可看 出Cr 和Cu 的浓度高值中心都出现在了西南角的工业带处。 但两者的不同之处为: Cr 的浓度在城区的大部分区域都大于背景值的最大浓度, 而Cu 的分 布正好相反。 图 2-5 图 2-6 图 2-5 给出了 Hg 在该区域的空间分布:可以看点 Hg 有三个高值中心 区 域 1、2 和 3,这三个区域都分布在工业区的附近,并且还可以看出这三个高值 中心处的等值线都十分密集。 图 2-6 给出 了 Ni 在该 区域的空间分布:区域 1 和区 域 2 是 Ni 浓度的两个 高 值中心, 大约占该城区面积的 1/3, 但在远离工业区的生活区交通区、 绿地和山 区,Ni 的浓度普遍较

11、小。 1 1 1 2 3 1 2 5 图 2-7 图 2-8 图2-7 给出了Pb 在该区域的空间分布: 浓度 的高值中心区域 1 分布在工业带 上而另一个高值中心区域 2 在交通 区内。这可能反映了 Pb 污染的来源主要是工 业废水废渣和交通工具尾气的排放。 图 2-8 给出了 Zn 在该区域的空间分布:从图中可以看出 Zn 的出现了三个浓 度高值中心分别标为区域 1、2 、3 , 并且影响范围较广, 在生活区、 交通区和绿 地的大部分区域内 Zn 的浓度普遍都比较高。 我们引入一个区域污染程度指数 k I 来衡量不同区域重金属的污染程度,定 义如下: 8 11 1 () m k i ij

12、ij IY m (1) 其中 k 表 示 不 同 功 能 区 , i 表 示 金 属 种 类 , m 表 示 金 属i 在 功 能 区 k 内的样本个 数。 ij i ij i xx Y ( ij x 为样本 j 中金属i 浓度, i x 、 i 分别表示金属i 浓度背 景值的平均值和标准差) , i 为权重, 由公式 8 1 i i i i e e 求得, 中 i e 值见表1 1 . 表 1 八种重 金属的毒性系数 重金属 Zn Cr Cu Pb Ni As Cd Hg 毒性系数 e 1 2 5 5 5 10 30 40 我们运用 matlab 软件,对剔除 异常值后的数据进行分析计算,得

13、到的数值 如下,见表 2: 1 2 1 3 2 6 表 2 五个功 能区的区域污染指数 功能区 生活区 工业区 山区 交通区 公园绿地区 区域污染指数 6.0232 36.5382 0.7511 24.8282 6.5437 通过 表 2 中的数值我们分析 可以得到:污染程度从高到低依次是工业区、交 通区、公园绿地区、生活区和山区,其中工业区的污染程度远大于其他功能区, 而山区的污染程度远小于其他功能区, 同时, 交通区的污染程度也较大, 比较而 言,公园绿地的污染程度相对较小。 根 据 上 面 的 分 析 , 我 们 可 以 发 现 各 种 重 金 属 在 城 区 的 含 量 基 本 都 大

14、 于 背 景 值 中的最大值, 可以说明土壤表层重金属的含量受人类活动的影响。 而人类活动引 起的重金属污染大致可以分为 三种类型: 工业废水废渣污染、 生活垃圾污染、 交 通废气污染。下面我 们对八种重金属做 来源解析。 我们可以通过分析不同元素之间的相关性来衡量不同元素同源的可能性大 小, 一般情况下, 若元素之间的相关性显著, 说明它们来自同一污染源的可能性 较大。Person 相 关 分析 就 是 研究变 量 间 相关程 度 的 一种统 计 分 析方法 , 通 过 计 算 在 一 定的显 著 性 水平下 的 相 关系数 来 衡 量不同 元 素 之间的 相 关 性。Person 相 关系

15、数取值在-11 之间,绝对值越大,说明相关性越显著。 为 了 分 析 重金 属 污 染 的主 要 原 因 ,我 们 可 以 计算 八 种 重 金属 元 素 的 Person 相关系数, 可以认为相关性高的重金属 元素是同源的。 陈怀满等人曾对我国土壤 重金属污染的主要来源进行了总结表 2 (见表3-1),表明在我国工矿生产、 农业 活动、 污灌等人为活动都是造成土壤重金属污染的重要来源。 然后进一步分析该 类重金属污染的主要原因。 表 3-1 我国 土壤重金属污染的主要来源 来源 重金属 矿产开采、冶炼、加工排放的废气、废水和废渣 Cr、Hg、As、Pb、Ni、Mo 煤和石油燃烧过程中排放的飘

16、尘 Cr、Hg、As、Pb 电镀工业废水 Cr、Cd、Ni、Pb、Cu、Zn 塑料、电池、电子工业排放的废水 Hg、Cd 、Pb、Ni、Zn Hg 工业排放的废水 Hg 染料、化工制革工业排放的废水 Cr、Cd 汽车尾气 Pb 农药、化肥 As 、Cu、Cd 我们运用 spss 软件,在显著性水平为 0.01 的情况下,对题目所给的八种 重金属元素含量数据进行 person 相关分析,并对不同金属之间的相关性进行双 侧检验,得到的相关系数如下表 3-2: 7 表 3-2 不同 金属间的相关系数 相关系数 As Cd Cr Cu Hg Ni Pb Zn As 1 Cd 0.255 1 Cr 0.

17、189 0.352 1 Cu 0.160 0.397 0.532 1 Hg 0.064 0.265 0.103 0.417 1 Ni 0.317 0.329 0.716 0.495 0.103 1 Pb 0.290 0.660 0.383 0.520 0.298 0.307 1 Zn 0.247 0.431 0.424 0.387 0.196 0.436 0.494 1 分析表 3-2,我们可以得到如下结论: 土壤中重金属 Cu、Cr、Ni 含量的相关性显著, 其中Cr 、Ni 的相关性极其 显著,表明它们来自同一污染源的可能性很大。 土壤中重金属 Pb 与Cd、Pb 与Cu、Zn 与Pb 含

18、量之间达到了显著的正相关, 表明它们来自同一污染源的可能性很大。 土壤中重金属 Pb 与 Cd、Cu、Pb 具有显著的相关性,表明土壤中 Pb 的污 染源可能比较多、来源途径较多。 土壤中重金属 Hg、As 与其它各重金属之间的相关性不强, 表明土壤中 Hg、 As 的来源可能比较独特,具有自己特有的污染源。 若土壤表层中重金属的浓度大于背景值取值范围中最大值的浓度,我们将认 为其受到污染, 反之, 则为无污染。 将功能区作为前项, 土壤表层某金属是否收 到污染作为后项, 利用关联规则挖掘, 分析不同功能区与 受各种金属 污染的可信 度,见表 4。 表 4 不同功 能区 中各种金属污染的关联规

19、则 As 的关联规则分析 Cd 的关联规则分析 Rule Confidence(%) 交通区=As 污染 山区=无As 污染 50 83.33 生活区=As 污染 公园区=As 污染 68.18 74.29 工业区=As 污染 61.11 Rule Conifence(%) 交通区=Cd 污染 76.81 山区=Cd 无污染 74.24 生活区=Cd 污染 72.73 工业区=Cd 污染 86.11 Cr 的关联规则分析 Cu 的关联规则分析 Rule Conifence(%) 山区=无Cr 污染 公园=无Cr 污染 77.27 77.14 生活区=Cr 污染 工业区=Cr 污染 43.18

20、38.89 Rule Conifence(%) 交通区=Cu 污染 81.88 山区=无Cu 污染 75.76 工业区=Cu 污染 91.67 生活区=Cu 污染 72.73 公园区=Cu 污染 68.57 8 Hg 的关联规则分析 Ni 的关联规则分析 Rule Conifence(%) 山区=无Hg 污染 95.45 交通区=Hg 污染 40.58 工业区=Hg 污染 52.78 生活区=Hg 污染 40.91 公园区=Hg 污染 40 Rule Conifence(%) 交通=无Ni 污染 80.43 山区=无Ni 污染 81.82 公园=无Ni 污染 85.71 工业区=Ni 污染 4

21、1.67 生活区=Ni 污染 27.27 Pb 的关联规则分析 Zn 的关联规则分析 Rule Conifence(%) 交通区=Pb 污染 63.04 山区=无Pb 污染 83.33 工业区=Pb 污染 80.56 生活区=Pb 污染 56.82 公园=无Pb 污染 60 Rule Conifence(%) 山区=无Zn 污染 87.88 公园=无Zn 污染 51.43 交通区=Zn 污染 71.01 工业区=Zn 污染 77.78 生活区=Zn 污染 59.09 通过表 4 我们可以得到每种金属的污染主要原因,结论如下: As 污染的主要原因分析: 在山区中无 As 污染的可信度为 83.

22、33%, 在公 园绿地区、 生活区和工业区的有 As 污染的可信度均大于60%, 这说明 As 主要来 源于工业废水废渣、生活垃圾,由于公园绿地大多与工业区、生活区交叉分布, 所以在公园绿地区 As 污染也较为严重。 Cd 污染的主要原因分析: 在山区中无 Cd 污染的可信度为 74.24%, 在工 业区、 交通区和生活区的有As 污染的可信度均大于70%, 这说明 Cd 主要来源于 工业废水废渣、 汽车尾气, 由于生活区大多在工业区与交通区之间, 所以在生活 区Cd 污染也较为严重。 Cr 污染的主要原因分析:在山区和公园绿地区中无 Cr 污染的可信度都 约为 77% ,在工业区和生活区的有

23、 Cr 污染 的可信度大约 40%,这说明 Cr 主 要来 源于工业废水废渣、生活垃圾。 Cu 污染的主要原因分析:在山区和公园绿 地区中无 Cu 污染的可信度都 约为 75.76%,在工业区、生活区和交通区的有 Cr 污染 的可信度大约 70%,其中 工 业 区 高达 91.67%, 这 说 明,工 业 废 水废渣 、 汽 车尾气 、 和 生活垃 圾 的 堆 放 都 是Cu 污染的重要原因,其中工业和交通的污染尤为重要。 Hg 污染的主要原因分析:在山区中无 Hg 污染的可信度高达为 95.45%, 在工业区有 Hg 污染比较严重,另外在交通区,生活区和公园绿地区都有污染但 较轻,这说明,H

24、g 的主要污染来源于工业。 Ni 污染的主要原因分析:在山区 、交通区和公园绿地区中无 Ni 污染的 可信度都大于 80%, 工业区中有 Ni 污染的置信度为41.67%, 这说明 Ni 污染主要 来源于工业废水废渣。 Pb 污染的主要原因分析:山区中无 Pb 污染的的可信度大于 80%,公园 区无 Pb 污 染的可信度为 60%,交通区和生活区有 Pb 污 染的可信度均大于 55%, 工业区中有 Pb 污染的可信度大于 80%, 这说明Pb 污染的主要来源于工业废水废 渣 和 交 通工具 尾 气 的排放 , 而 生活区 主 要 分布在 交 通 区的附 近 , 所以生 活 区 Pb 污染也较为

25、严重。 Zn 污染的主要原因分析: 山区中无 Zn 污染的可信度高达 87.88%, 在交 通区和工业区中有 Zn 污染的可信度均大于 70%, 生活区中有 Zn 污染的可信度约 9 为 60%,这说明 Zn 污染主要来源于工业废水废渣、汽车尾气的排放,还有一部 分来源于生活垃圾。 综合各金属污染主要原因,我们可以进一步得到更多结论: 无论何种金属在山区中无污染的可信度都很高, 都大于 70%, 说明山区受 人类活动影响的程度最小; 八种金属在工业区中有污染的可信度都很高, 说明工 业区受人类活动影响的程度最大,工业的废水废渣是污染 的重要原因。 Pb 和 Cu 在交通区和生活区的污染可信度均

26、比较大,说明这两类金属同 源, 主要来源于工业废水废渣和交通工具尾气的排放。 这与 3.2.1 中相似系数分 析的结果一致。 Pb、Zn 和Cd 的污染均在山区和公园绿地去较少,而在其他几个区较高。 说明这三类金属同源, 主要来源于工业废水废渣、 汽车尾气, 还有一部分来源于 生活垃圾的堆放。这与 3.2.1 中相似系数分析的结果一致。 Cu、Cr、Ni 的污染均在工业区和生活区较多, 说明 这两类金属同源, 主 要来源于工业废水废渣和生活垃圾的堆放。 这与 3.2.1 中相似系数分析的结果一 致。 由于 定性分析重金属污染物的传播特征 需要较强的专业知识背景 ,而所给数 据的变量不多(变量仅

27、坐标、高度与功能区) ,统计学方法又不足以完全揭示变 量与污染物传播特征的关系。 一方面, 人工神经网络具有较强的自组织、 自适应 与自学习能力, 能够在未完全了解重金属污染物传播机理的情况下, 完成自变量、 变量间与重金属污染物浓度之间的非线性映射; 另一方面, 将重金属污染传播过 程看作网络输入与输出的 一类非线性映射,但是仅通过网络的输入输出数据难以 准确寻找重金属污染物浓度的极值 (即污染源) , 而遗传算法具有全局的非线性 寻优能力。 综合上述考虑, 我们建立神经网络结合遗传算法求解重金属污染源的 数学模型。 1、BP神经网络的建立污染传播模型 1.1 BP神经网络原理简介 BP神经

28、网络是一种多层前馈神经网络,该网络的主要特点是信号前向传递, 误差反向传播。在前向传递中,输入信号从输入层经隐含层逐层处理,直至输出 层。 每一层的神经元状态只影响下一层神经元状态。 如果输出层得不到期望输出, 则转入反向传播,根据预测误差调整网络 权值和阈值,从而使BP 神经网络预测输 出不断逼近期望输出 3 。 1.2数据预处理 原始的319组数据显然不能满足神经网络的训练要求,因此,我们从问题一 中插值过后的60501组数据中随机选择10000组数据。 前9900组作为BP网络的训练 数据集,后100组数据作为BP网络的检验数据集。 数据 归一化可以方便后面数据的处理, 并保证 程序运行

29、时收敛加快 。 我们将 数据集按如下公式进行归一化处理: 10 max min min min max min ( )( ) y y x x yy xx (2) 其中 , max 1 y , min 1 y ,x 为需要归一化的数据集。 matlab中函数“mapminmax ”实现了上述归一化方式。 命令为inputn,inputps=mapminmax(input_train) ;其中,inputn为归一 化后的数据集,inputps为原始数据集信息,input_train为原始数据集。 1.3建立BP 网络 虽然在问题一中将原有数据经过插值可以比较准确的反应重金属浓度随地 理位置的变化,

30、 但是插值过程中并没有考虑地形对重金属污染 物传播的影响。 所 以,我们建立3 N 1 的BP网络 结构,其中,3 表示输入项(分别为坐标x ,坐 标y,高度z); N 为隐藏层神经元个数;1 表示输出项(重金属污染物浓度) 。结 构图如下: 图3 BP神经 网络结构图 隐藏层传输函数选择双曲正切S形函数: nn nn ee a ee 输出层传输函数采用线性函数:an 隐藏层神经元个数对BP神经网络预测精度有显著的影响,节点数太少,网络 不能很好地学习,需要增加训练次数,训练的精度也受影响;节点数太多,训练时 间增加, 网络容易过拟合 3 。我们参考如下公式来确定最适隐藏层神经元个数。 1 l

31、n (3) () l m n a (4) 2 log ln (5) 式中,n 为输入层节点数;l 为隐含层节点数;m 为输出层节点数;a 为010之 间的常数。在实际问题中,隐含层节点数的选择首先是参考公式来确定节点数的 大概范围,然后用试凑法确定最佳的节点数。 经过多次试验, 我们选择N=100,此 时BP神经网络达到了较高的精度。 学习速度同样对BP神经网络具有重要影响作用, 学习速度太小, 网络学习缓 慢, 需要增加训练次数; 学习速度太大, 网络学习迅速, 但是容易导致网络不 收 敛,影响训练的精度。我们最终决定学习速度为0.01,训练次数为300。 BP神经网络的采用梯度修正法作为权

32、值和阈值的学习算法,从网络预测误差 11 的负梯度方向修正权值和阈值,没有考虑以前经验的积累,学习过程收敛缓慢。 对 于这个问题,可以采用附加动量方法来解决,带附加动量的权值学习公式为: ( ) ( 1) ( ) ( 1) ( 2) w k w k w k a w k w k (6) matlab 神经网络工具箱中函数“traingdm ”即实现了上述学习方式。 1.4结果输出 训练好的BP神经网络还只能输出归一化后的浓度数据, 为了得到真实的数据 值, 我们还必须对输出数据进行反归一化。 反 归一化过程可以利用归一化过程中 的信息,通过函数“mapminmax ”来实现。具体如下: BPou

33、tput=mapminmax(reverse,an,outputps); 其中,BPoutput为反归一化后的数据,an为神经网络预测输出,outputpa为 原始输出数据集信息。 2BP神经网络结果分析 以Cu 元素为例,训练结束的神经网络性能图如下: 图4 BP神经 网络训练性能 如图4, 训练在第222次迭代过程达到均方误差最小,MSE=0.00044917 。 此时, 训练结束。 用训 练好的神经网络预测重金属污染,如图5。 图5-1BP 网络 预测输出 图5-2 神经网络 预测误差 可见,预测输出与期望输出相差不大,基本达到了我们要求的效果。 下图为神经网络的预测误差。 结合图5-1

34、分析,神经网络在个别点上误差较大。但由于污染物浓度随空间 变化总是渐变的,这类误差不会影响我们寻找污染源。 12 进一步, 我们用训练好的神经网络模拟出了整个城区 各种金属的 污染传播特 征图,如 图6: 图6 神经网络 模拟八种重金属污染分布特征 13 2、遗传算法求解模型 训练好的神经网络可以准确地模拟各 种重金属污染传播的特征, 但是由于神 经网络是一个 “黑箱” , 仅通过网络的输入输出数据难以准确寻找重金属污染物 浓度的极值(即污染源),我们在此引入遗传算法,通过区域分割的方法(某些 污染物可能不止一个污染源)寻找污染源。算法流程图 3 如下: 图7 算法流程 图 2.1区域划分 不

35、同的重金属污染源可能不同, 同时重金属的污染源也可能不止一个。 基于 遗传算法只能寻找到全区污染最严重的区域的考虑, 我们将功能区分布图划分为 9块,分别在每块图中利用遗传算法寻找污染源,然后对比 表五 神经网络模拟出 来的污染传播特征图 ,确定污染源的位置。 区域划分图如下所示: 图8 功能区 分布图 14 2.2遗传算法编码 神经网络要求有3个输入项, 分别为坐标x, 坐标y, 高度h 。 但是对于某一固 定点 (x ,y) , 此处的高度是不能随机更改的, 因此, 我们在遗传算法编码的时 候仅对 (x,y) 进行编码, 编码采用二进制方式, 长度为10。 对于已经生成的个 体(x,y)

36、, 我们通过取整将其固定到问题一插值生成的网格点之上, 用该网格 点的高度值作为此个体的高度。 2.3 程序中使用的遗传算法算子 以下算子均来自英国设菲尔德大学编写的GA工具箱 4 选择算子:采用随机遍历抽样,其调用函数为“sus” ; 交叉算子:采用单点交叉,其调用函数为“xovsp”; 变异算子:采用一定几率简单变异,其调用函数为“mut”; 重插算子: 设置代沟为0.9 , 每次将适应度最高的90%保存下来, 其余10% 通过重插生成,其调用函数为“reins”; 2.4遗传算法结果分析 下面给出了遗传算法在区域一中, 查找的污染源的性能图像, 算法最后返回 最大浓度Max_densit

37、y=2.701940704296362e+003 ;坐标x=2101.7 ;坐标y=3390.0 。 图9 遗传算法 查找Cu 污 染源 性能图 结合图8,我们可以确定Cu 在区域1中的污染源在(2101,3390 )附近,其浓 度为2702ug/g 。 分析样本点, 我们发现样本点中浓度最大值出现在 (2383,3692) 处,并且最大值为2528ug/g。 由此能说明该 模型能较为准确地 反映污染源位置。 分析其他重金属, 下表为遗传算法的结果并结合 图6综合分析得到的污染源中心位置 ,见表5 表5 土壤中 重金属污染源中心坐标和浓度 As Cd Cr Cu x y 浓度 x y 浓度 x

38、 y 浓度 x y 浓度 1200 3006 13.2 2105 2593 1267 3487 5325 868 2101 3390 2701 18508 10206 19.5 4753 10875 1247 - - - 3198 5822 812 27680 12111 17.5 17450 3825 1034 - - - - - - - - - 21301 11467 813 - - - - - - 15 (续表) Hg Ni Pb Zn x y 浓度 x y 浓度 x y 浓度 x y 浓度 2643 2875 15620 3211 5686 109 1991 3329 481 1699

39、 2867 1403 13868 2354 10530 24001 12366 50 4508 5412 307 3725 5487 1558 15243 9186 5703 - - - - - - 9583 4512 1439 - - - - - - - - - 13653 9655 2064 对该结果我们进行进一步验证, 观察样本点中最大值点的位置和浓度, 比较 发现八种重金属通过模型得到的污染源的位置基本处于样本点中最大值点的附 近,反映该模型 对污染源位置的寻找 具有较好的准确性;同时, 计算得到的Cu 和Pb在污染源位置的浓度 高于样本点浓度 的最大值, 效果较佳; 但是As在污染源

40、 位置的浓度低于样本点浓度的最大值,效果 略差。 综合分析所得污染源 所 在 位 置 ,发现不同金 属 的 污 染 源有同源现象 , 依据 同源性汇聚污染源 , 得到了五个主要污染源, 其中一个污染源呈带状分布 , 绘制 了八种重金属的污染源 汇总图 。 如下: 图10 重金属 污染源分布图 另外, 我们在图6中的神经网络模拟污染传播特征图中发现重金属As、Cd和 Pb在城区外同一地区出现污染浓度高值中心。 因为城区边界的原始样本值浓度向 城区外方向是逐渐增大的, 所以,我们推测这里可能存在As,Cd,Pb的污染源, 见图10中虚线所 围区域。 16 模型的优点: 第一问中虽然用三角形线性插值

41、法也能拟合出各重金属 的 空 间 分 布 情 况,但三角形线性插值法 只利用了原始数据的 x、y 坐标来做插值拟合,忽略了 各样本点 高度的信息, 由于重金属浓度分布也是受地形影响的 ( 如地形影响地下 水 径 流 ,将地 势 高 处的水 溶 重 金属带 到 地 势低处 , 从 而在地 势 低 处堆积), 所以 分布结构不够精确。 而神经网络模型 利用了采样点的位置坐标 (x、y ) 和高度坐 标h,能更精确地拟合出 重金属的 空间分布情况。 由 于 浓 度 分 布 是 多 种 因 素 共同影响的结果 , 很 难 准 确 地 给 出 各 种 因 素 共 同作用的公式 。神经网络很好地解决了这个

42、问题 。神经网络具有较强的自组织、 自适应与自学能力, 能够在未完全了解重金属污染 物传播机理的情况下, 完成自 变量、因变量之间的非线性映射。 模型的缺点: 由于神经网络构建所需数据量较大, 而题目所给原始数据只有 300 多个, 此数据量较小,所以不能更加精确地 拟合出重金属的空间分布情况。 研 究 城 市 地 质 环 境 的 演 变 模 式 , 即 在 本 文 章 的 背 景 下 就 是 研 究 八 种 重 金 属 在土壤表层中 浓度分布的演变模式。 其中我们主要研究的是人类活动影响下城市 地质环境的演变模式 。 为 了 更 好 地 研 究 此 模 式 我 们 还 需 要 搜 集 前 几

43、 年 该 城 区 八 种 重 金 属 浓 度 的 采 样数据。 而 人 类 影 响 表 层 土 壤 重 金 属 浓 度 的 因 素 主 要 有 工 厂 分 布 多 少 位 置 的 变 化、 交通路段车流量的变化、 人口及生活区分布变化和植被分布多少 位置的变化 等。 所以我们还应搜集近几年工厂分布多少位置的变化、 交通路段车流量的变化、 人口变化、 生活区分布变化和植被分布多少位置的变化的信息来研究 城市地质环 境的演变模式 。 首先,我 们 利 用 前 几 年 该 城 区 八 种 重 金 属 浓 度 的 采 样 数 据 , 运 用 第 三 问 所 建立的神经网络的模型 求解出 该城区每年八种

44、重金属的污染源 。 然 后 , 利 用 近 几 年 工 厂 分 布 多 少 位 置 的 变 化 、 交 通 路 段 车 流 量 的 变 化 、 人 口变化、 生活区分布变化和植被分布多少位置的变化的信息来分析人类活动对该 城区八种重金属污染源的影响。 具体做法可以是: 把各污染源的年分布变化与上 述人类影响 因子在该污染源附近 的年分布变化一一进行相似性分析, 相似系数高 的因素对该污染源变化影响贡献大。 最 后 , 对 影 响 每 种 重 金 属 污 染 源 大 的 人 类 影 响 因 子 进 行 汇 总 整 合 , 从 而 得 到该城市地质环境的演变模式 。 17 1 徐 争 启, 潜 在

45、 生态危 害 指 数法评 价 重 金属毒 性 系 数分析J , 地球 科 学 与 技 术报,第 31 卷,第2 期:2008. 2 林艳,基于地统计学与 GIS 的土壤重金属污染评价与预测D,中南大学, 2009. 3 matlab 中文论坛编注,matlab 神经网络30 个案例分析, 北京: 北京航天航 空大学出版社,2010. 4雷英杰,matlab 遗传算法工具箱及应用, 西安:西安电子科技大学出版社, 2005. 5 夏立红,土壤污染及其防治,上海 :华东理工大学出版社,2001. 18 附录 % 由于程序较 多,仅给出 Cu 元素的相关 程序,其余程序相应修改即可! functio

46、n readdata() data=xlsread(data,sheet1,B4:E322); save data data % 坐标 信息 data1=xlsread(data,sheet2,B4:I322); save data1 data1 % 浓度 信息 beij=xlsread(data,sheet3,B4:C11); save beij beij % 背景信 息 %* % 程序功能: 画 Cu 污染分 布等值线图 % 建立日期:2011/9/9 % 程序员:Hec1990 %* function drawcu() clc,clear load data load data1 Cu=

47、data1(:,4); X=data(:,1); Y=data(:,2); Cu_XY=X Y Cu; x y=meshgrid(0:100:3e4,0:100:2e4); z=griddata(Cu_XY(:,1),Cu_XY(:,2),Cu_XY(:,3),x,y,v4); mesh(x,y,z) %ezsurfc(z,x,y) figure c h=contour(x,y,z); clabel(c,h) hold on c1 d1=find(data(:,4)=1); x1=data(c1,1); y1=data(c1,2); plot(x1,y1,r*); 19 c2 d2=find(

48、data(:,4)=2); x2=data(c2,1); y2=data(c2,2); hold on plot(x2,y2,k*) c3 d3=find(data(:,4)=3); x3=data(c3,1); y3=data(c3,2); plot(x3,y3,c*) c4 d4=find(data(:,4)=4); x4=data(c4,1); y4=data(c4,2); plot(x4,y4,y*) c5 d5=find(data(:,4)=5); x5=data(c5,1); y5=data(c5,2); plot(x5,y5,g*) grid on legend( 等 值线, 生活 区, 工业区, 山区, 交通区, 绿 地区); cu=reshape(z,301*201,1); a=reshape(x,301*201,1); b=reshape(y,301*201,1); save cu a b cu % 训练 神经网络数据集 save dist c1 c2 c3 c4 c5 % 不同 区域 %*

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报