1、地质统计学课程读书报告地质统计学读书报告地质统计学包含经典统计学与空间统计学,按其基本原理可定义为:地质统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性,又有结构性的自然现象的科学。其为数学地质领域中一门发展迅速且有着广泛应用前景的新兴学科。国内外的生产实践表明,地质统计学除了在异常评价、找矿勘探、矿体圈定、储量计算、采矿设计、矿山生产及地学科研等方面具有明显的优越性外,它在石油地质、第四纪地质、地层学、生物学、生态学、岩石学、地球化学、构造地质、地震地质、海洋地质、农业、水文地质、工程地质、古气候、古地理、环境、林业、医学等许多方面都有成功应用的实例。地质
2、统计学在不到 50 年的研究和实践中得到了很大的发展 1。一、理论研究及进展经历了数十年的发展,地质统计学的理论与方法研究有了很大的提高 2-3。包括:从初期二维平面分析到三维立体空间的静态估计,发展到今天在时空域内对研究对象进行四维乃至更高维空间的动态估计和模拟。Journel 4将克立格法的估值问题,从一般矢量空间扩展到个原始数据的全部可测度函数所形成的矢量空间(希尔伯特空间)进行考察;在单变量区域化变量理论的基础上,提出了适合多变量的协同区域化理论 4;发展了许多计算变异函数(或协方差函数) 的方法;线性地质统计学与非线性地质统计学共同发展;参数地质统计学与非参数地质统计学相互补充。Ma
3、theron 5为首的参数地质统计学派以正态假设为前提,在协同区域化理论的基础上,提出多元地质统计学的基本思想。Journel 发展了无须对数据分布作任何假设的非参数地质统计学,提出了一些非参数地质统计学克立格方法;由于时空多元地质统计学的研究得到重视,早期空间域静态建模技术的研究逐渐过渡到研究时空域多元动态条件模拟,各种模拟方法得到了发展;早期的等因子模型的因子是埃尔米特多项式,它要求原始数据服从正态分布。为了拓宽等因子模型的应用,Matheron 提出了离散的等因子模型和连续的等因子模型,Rivoirard 利用析取克立格技术建立了正交指标剩余模型,Lajauine 和 La ntuejo
4、ul 等也提出了建立等因子模型的一些方法;已有的地质统计学方法相互融合。如指示克立格法与协同克立格法相结合形成指示协同克立格法;指示克立格法与因子克立格法相结合形成主分量指示克立格法;协同克立格法与其它不同的线性地质统计技术相结合形成各种协同克立格技术等 6。这里重点介绍一下多点地质统计学 7。多点地质统计学是相对于基于变差函数的两点地质统计学而言的。在两点统计里,储集层相关性通过空间两点协方差( 变差函数) 进行描述。在多点统计里,则是利用空间多个点组合模式进行描述。空间多点组合样式称为数据样板,如果在空间点赋予了值,则为一个特定的空间多点组合模式,称为数据事件。在建模时,对每一个未知点,估
5、计在其处满足给定条件的数据事件出现的概率,随后抽样获得未知点处值或者数据事件,即完成单次模拟。一旦所有节点得到访问,即完成一次模拟实现。二、地质统计方法应用及进展克立格估计方法概述 8-9:克立格法是法国 Mathron 以南非矿山工程师D.G.Krige 的名字命名的一类方法。简单地说是一种特殊的加权移动平均法。是一种对空间分布数据求最优线性无偏内插估计量的方法。根据估计式形式、区域化变量平稳性、分布及涉及的区域化变量个数等克立格方法有如下分类 10:1.线性克立格法非线性克立格法2.参数克立格法非参数克立格法(指示、概率)3.平稳克立格法(普通)非平稳克立格法(泛克立格)4.单变量克立格法
6、多变量克立格法(多元克立格)指示克立格法1.基本思路在地质、物探化探数据处理及相关储量计算中往往存在以下情况:(1)特异值的出现。所谓特异值是指那些比全部数值的均值或中位数高得多的数值。它既非分析误差所致;也非采样方法等人为误差引起,而是实际存在于所研究的母体之中,这些特异值只占全部数据的极少部分,但却控制了总金属资源量的很大比例,同时局限于一定的空间位置 11。(2)在一个研究区或一个矿床中存在几种不同类型的矿化作用,这也影响了品位和储量的精确估计。(3)在矿山地质工作中经常要知道诸如:在区 A 及其附近,大于边界品位值Z 的可选采矿单元占多大比例全部可选采矿单元的平均品位是多少等等。为了解
7、决上述问题,地质学家及统计学家进行了许多有成就的研究,而指示克立格法是一种更好的非参数地质统计学方法,它可以在不必去掉重要而实际存在的高值( 特异值) 数据的条件下处理各种不同的现象,而且给出在一定风险条件下未知量 Z(x)的估计量及空间分布。2.指示函数及其二阶矩指示函数定义:设在矿床 D 上得到了某金属的品位值,约定其边界品位为Z,则在 D 上的每一样品点 x D 上定义一个 Z 的阶梯函数:ZxxZI )(,01);(点 上 品 位 值当 点 上 品 位 值当在 D 上的任一区域 A D 内,低于边界品位 Z 的品位值 Z(x)占区域 A 的比例表示如下: 1,0);(1);(dxziZ
8、A称为废石函数,而高于边界品位 Z 的品位值 Z(x)所占区域 A 的比);(ZA例为:,)();(1);( AxZPZA称为矿石回收率。 指示函数的二阶矩。在边界品位 Z 确定的条件下,随机函数 I(x;Z)服从二项分布,其期望值是平稳的,与 x 无关。 ZkZkk pprobx)(F() =I(; E二项分布的概率函数 knkXr)1(Cn非中心协方差是 )()();(,;();( ZxhxZprobxIZhIEZhKI 同 时方差是 ()F-)(0;C=)VarI(; 2I中心协方差是 )();();(211 ZhKZ变异函数是 );();0);();(2);( 2ZhKFCxIxIEh
9、IIII(x;Z) 满足平稳假设指示克立格方法废石函数的估计:估计量设计:设在矿床 D 上有 N 个有效数据,在 D 上的一个域 A D 内有n 个有效数据 ,给定边界品位值为 Z,则指示函数空,.21,),(nAxZ间为: ,.3),;(nZxi有 的估计值可以表示如下:);(ZAnZxiA1* );();(若给一系列边界品位值 时: ,这时,估计量可写为:lZLl,.21,nlll ZxiA1* );();(克立格方程组建立:在无偏和估计方差极小的条件下为求可得权系数 满足的方程组,即指示克立);();(*lZA或 ),.2,)(nZ格方程组: nZZAxxn ii ,.211)( );,
10、();,1 估计方差的表示:其指示克立格方差 n iiKI ZAxZ12 );,();,()表示在给定的边界品位 Z 条件下,矢量 h 的两个端点分别在信);,(Zxi息域 内的所有对点的平均指示变异函数值;表示在给定边界品位 Z 条件下,矢量 h 的两个端点在待估域 A);,(Ai内所有对点的平均指示便宜函数值;表示在给定边界品位 Z 条件下,矢量 h 的一个端点在信息域);,(Zxi内,另一端点在待估域 A 内所有对点的平均指示半变异函数值;为拉格朗日乘子。协方差函数表示的方程及方差:用协方差函数分别表示如下: nZZAxCxCn ii ,.211)( );,();,1 );,();,(1
11、2 ZAxAnKI若有 l 个边界品位 就应该解 l 个指示克立格方程组。,.1LlZ废石函数的意义:相应位置品位值低于 Z 的概率废石函数的作用:用于概率估计及品位值估计待估域 A 平均品位的指示克立格法估计,待估域 A 平均品位的指示克立格法是应用某种克立格法求得 的线性估计值 ,最后得到待估域 A);(A);(*的平均品位及储量。设待估域 A 约定在位置 x 上,分两种情况讨论如何用指示克立格法求待估域的估计值 。由两种矿化类型组成的矿床中位置 x 的平*Z(x)均品位的估计。指示函数值定义如下: 类 型 矿 化属 于当 类 型 矿 化属 于当 2.011)(xxI则任一位置 x 处的
12、I(x)的平均值 为:)(*I个 数 据类 型 矿 化 , 给 定 的个 数 据 nxprobnIaIn1|)(* 个 数 据类 型 矿 化 , 给 定 的I2)(1; 。*x0, )(*xI10,位置 x 上 1 类型矿化的品位是根据 x 周围 个 1 类型矿化品位值n求得:),.2)(1nZ)(1|( 11*xZbxZn类 型 矿 化位置 x 上 2 类型矿化的品位是根据 x 周围 个 2 类型矿化品位值求得:),.1)(2nZ2221*)(2|( nxZbxZ类 型 矿 化最后,位置 x 的估计品位 可上述计算结果综合得到:*)。* |)(1|)()( 型 矿 化型 矿 化 xIIZ由
13、l 个矿化类型 组成的矿床中位置 x 的平均品位的估计。在实际工作)2(l中,任一位置 x 上只能有一种矿化类型(如 l 型矿化)占优势,这时:否 则 类 型 矿 化属 于当.01)(xIl位置 x 处矿化属于 l 型的概率为: 个 数 据型 矿 化 , 给 定 的 lnaall nxprobIIl l*11,0)()(同上此处 l 型矿化品位为: )(|)( 11*xZblZn型 矿 化最后,位置 x 的估计品位 为*x*1* |)()( 型 矿 化lxZIZll 概率克立格指示克立格只用了截断值 的指示数据,指示协同克立格还考虑了所有的kz指示数据。如何能既考虑 z-数据本身,还考虑它分布
14、于 0,1之间的标准化次序转换数据,求得 Z(x)的分布;概率克立格(PK)估计,实际上是 Z(x)的 ccdf 模型,可以写为简单克立格的形式: nkkkkkPKk xpzzFizFzxi 1* 5.0)(;()(;)();(其中 是数据 的 cdf 变换,它的期望值为 0.5,,0)()(xzp)x是 的平稳 cdf, 和 分别是指示数据Prob)(ZzF;(kz);(kzx和均匀数据的协同克立格权值。注意这些权值依赖于位置(x)和截断值 。()zk对应的简单克立格方程组(PK 方程组)要求推导和模拟(2K+1)个(互)协方差函数,即 K 个指示协方差函数、K 个指示均匀互协方差函数和一个
15、均匀变换数据的协方差函数。这对于变差函数模拟的要求仍然较高,在应用中是一个很大的缺陷。软克里格:马尔科夫贝叶斯模型指示克立格法产生后验条件概率分布(cdf)最主要的优势在于它能够考虑软数据。只要软数据或模糊数据能被编码成先验局部概率值,指示克立格就能把那种信息综合到后验概率值中。先验信息可以是以下的某种形式:1.来自于局部硬数据 z(x)的局部硬指示数据 i(x;z): 0);(1);(01;( kkk sxisxixzziz , 否 则,类 型 变 量如 果或 者 , 否 则,如 果2.来自于有关局部数据 的硬不等式限制条件的附加信息的局部硬指示)(数据 ,如果 ,那么:);(zxj,bax
16、bzazj如 果,未 定 义 , 如 果如 果, 1, 0);(3.来自于有关数值 z(x)的先验(预后验)概率值的附加信息的局部软指示数据 y(x;z): 率下 面 定 义 的 局 域 先 验 概且 局 部 信 息F(z);( 0,1|ProbZxxy适用于平稳地区 A 的所有位置 x 的区域先验信息: Axz,)(rob)(对任何位置 ,有关数据 的先验信息都能表达成以上四种类型中的xz任何一种。IK 过程是根据邻域的局部先验 cdf 所提供的信息,把局部的先验cdf 通过贝叶斯原理变换成后验 cdf: n nIKzxi zxiFzxZ1 10*);( );()(|)Prob是 n 个邻域
17、硬指示数据有关的权值, 是 n个邻域软指示数);(zx );(zx据有关的权值, 是区域先验 cdf 的权值。为了保证无偏性, 通常设为:0 0nnzxzxx110 );();()(如果 EY(x;z)或 EJ(x;z)不同于 F(z),则需要考虑其他的无偏性条件。上式的 ccdf 模型能被看成是把不同类型的信息,包括硬的 i 和 j 指示数据及软的 y-先验概率信息收集到一起的指示协同克立格。当不存在或忽略软信息时(n =0),表达式变成简单 IK 的表达式。参考文献1肖斌,赵鹏大,侯景儒.地质统计学新进展J. 地球科学进展 ,2000,03:293-296.2肖斌,赵鹏大,侯景儒.现代地质
18、统计学的新进展J. 世界地质 ,1999,03:81-87+91.3李黎,王永刚.地质统计学应用综述J. 勘探地球物理进展 ,2006,03:163-169+4.4Journel A G. Nonparameteric estimation of spatial distributionsJ. Math Geol , 1983, ( 3): 445 468.5Matheron G. The theory of Regionalized Variables and itsApplicati on M .France: Cen t re of Geostatistics Font ainebl e
19、au, 1970.6吕连宏,张征,迟志淼,李道峰,尚晓颖.地质统计学在环境科学领域的应用进展 J.地球科学与环境学报,2006,01:101-105.7尹艳树,张昌民,李玖勇,石书缘.多点地质统计学研究进展与展望 J.古地理学报,2011,02:245-252.8侯景儒.地质统计学发展现状及对若干问题的讨论J. 黄金地质 ,1996,01:1-11.9侯景儒.中国地质统计学(空间信息统计学 )发展的回顾与前景J.地质与勘探,1997,01:53-58.10吴胜和,李文克.多点地质统计学理论、应用与展望 J.古地理学报,2005,01:137-144.11尹艳树,吴胜和,张昌民,李少华,尹太举.基于储层骨架的多点地质统计学方法 J.中国科学(D 辑:地球科学),2008,S2:157-164.