1、,第二篇 地球化学数据处理,第四章 地球化学数据分析,第一节 地球化学数据的误差分析 一、误差的来源1取样产生误差取样产生的误差是影响地球化学数据质量的最重要的也是最不易被发现的误差。产生这种误差的途径可能有: 1)错误地将同一空间产出的不同单元作为同一单元。 2)没有正确确定不同空间的岩石是同一系列的同一单元还是不同系列的不同单元。 3)不能准确区分蚀变与原岩的界线。 4)判别风化岩石和新鲜岩石的界线不准确。 5)没有查明污染层的广度与深度。 6)土壤剖面分层不准确。 7)采集水样的时间或季节不当。 8)对矿化与非矿石岩石的区分不当。 9)未能消除因断层等构造对原岩中元素活化迁移的影响。 1
2、0)取样工具、器具及取样方法不当。,一、误差的来源,2制备样品产生误差1)没有将整个样品全部粉碎过筛,而仅粉碎了其易碎部分,难碎部分弃掉而造成粉碎的样品不代表整个样品。2)样品分选不彻底。3)筛网的原料不当,如不少样品不能用铜网或铁网筛。4)碎样工具和筛具清理不净,造成样品污染。5)样品缩分方法不当,未按缩分样品程序进行缩分而随意分取一部分样品。,3分析测试产生误差1)分析方法本身的原因,即分析的精度和灵敏度;2)分析测试人员因操作的原因而产生误差;3)所用器具清洗不净产生误差;4)仪器设备的精密度和分析结果的再现性达不到有 关要求而产生误差;5)化学试剂达不到分析要求或试剂选取不当产生误差;
3、6)标准达不到要求产生误差;7)分析测试环境产生误差。,一、误差的来源,分析误差产生的原因及其减免方法,一、 系统误差 1特点:影响准确度,不影响精密度(1)对分析结果的影响比较恒定,可以测定和校正(2)在同一条件下,重复测定,重复出现(3)影响准确度,不影响精密度(4)可以消除,2产生的原因:(1)方法误差选择的方法不够完善 例:重量分析中沉淀的溶解损失,滴定分析中指示剂选择不当(2)试剂误差所用试剂有杂质 例:去离子水不合格;试剂纯度不够,(3)仪器误差仪器本身的缺陷 例:天平两臂不等,砝码未校正;滴定管,容量瓶未校正 (4)主观误差操作人员主观因素造成 例:对指示剂颜色辨别偏深或偏浅;
4、滴定管读数不准,二、 随机误差(偶然误差)1特点: (1)不恒定,无法校正;(2)服从正态分布规律:大小相近的正误差和 负误差出现的几率机等;小误差出现的频率较高,而大误差出现的频率较低,很大误差出现的几率近于零。2产生的原因:(1)偶然因素(室温,气压的微小变化);(2)个人辩别能力(滴定管读数)注意: 过失误差属于不应有的过失。 三、误差的减免 (一) 系统误差的减免,1.方法误差采用标准方法作对照试验2.仪器误差校准仪器3.试剂误差作空白试验 (二) 随机误差的减免增加平行测定的次数,取其平均值,可以减少随机误差。,正态分布曲线,二、误差的消除1 内检2 外检3 双样品分析,第二节 地球
5、化学数据的预处理,一、基本概念1总体、个体、样本总体是指我们要研究的对象的全体;个体(或叫样品)是指总体中的一个单位;样本(或叫子样)是指总体中取出的一部分个体。样本所包含的个体数目。叫做样本的大小(或 叫样本容量)。,一、基本概念,2均值(1)算术平均值(2)加权平均值(3)几何平均值,一、基本概念,3极值与方差(1)数据的极小值与极大值极小值 A min x1,x2,xn极大值 B maxx1,x2,xn(2)方差、标准差4变异系数,一、基本概念,其它:真值、平均值、中位数 准确度和精密度准确度:表示分析结果与真实值接近的程度。精密度:表示各次分析结果相互接近的程度。 常用重复性和再现性表
6、示不同情况下的精密度。误差和偏差误差:测定结果与真实值之间的差值。偏差:测定结果与平均结果之间的差值。,准确度和精密度分析结果的衡量指标。 一 、误差和准确度准确度的高低用误差的大小来衡量;误差一般用绝对误差和相对误差来表示。 二 、偏差和精密度精密度的高低用偏差来衡量,,一、基本概念,总体平均值:测定次数无限增多时,所得平均值即为总体平均值:总体标准偏差:测量次数为无限多次时,各测量值对总体平均值的偏离,用表示。样本标准偏差s,二、数据的统计分组、列表与作图,对观察数据分组、列表与作图使我们对数值和频率分布、数值集中位置和离散程度等性质有了一个直观了解。,三、数据的初步统计分析,1正态分布及
7、置信度 正态分布就是通常所谓的高斯分布,是无限次测量数据的分布规律 。置信度通常用p表示,它表示在某一t值时,测定值落在(ts)范围内的概率。 例如:t0.05,10 置信度95自由度10时t值t0.01,5 置信度99自由度5时t值置信度越高,置信区间就越大,在统计学中,一般将置信度定在95或90。,S: 标准偏差 n: 测定次数,n=6,置信度真值在置信区间出现的几率 置信区间以平均值为中心,真值出现的范围,几种样本的置信区间,2. 显著性检验 可疑数据的取舍 过失误差的判断 1) Q 检验法 步骤: (1) 数据从小至大排列x1,x2 , ,xn (2) 求极差xnx1 (3) 确定检验
8、端:比较可疑数据与相邻数据之差xnxn-1 与 x2 x1 ,先检验差值大的一端 (4) 计算:,三、数据的初步统计分析,(5) 根据测定次数和要求的置信度(如90%)查表:,表2-2 不同置信度下,舍弃可疑数据的Q值表测定次数 Q0.90 Q0. 953 0.94 0.984 0.76 0.85 5 0.64 0.73 6 0.56 0.697 0.51 0.59 8 0.47 0.54 9 0.44 0.51 10 0.41 0.48,(6) 将Q计与Q表(如Q 0.90)相比, Q计Q表舍弃该数据, (过失误差造成) 若Q计Q表保留该数据, (随机误差所致) 当数据较少时舍去一个后,应补
9、加一个数据。,2)格鲁布斯(Grubbs)检验法 步骤: (1) 数据从小至大排列x1,x2 , ,xn (2) 计算该组数据的平均值 和标准偏差S (3) 确定检验端:比较可疑数据与平均值之差 -x1 与 xn ,先检验差值大的一端 (4) 计算:,讨论:由于格鲁布斯(Grubbs)检验法使用了所有数据的平均值和标准偏差,故准确性比Q检验法好。,(3)查表(表),比较:若F计F表,说明两组数据的精密度存在显著性差异若F计F表,说明两组数据的精密度无显著性差异,再用t检验法检验两组数据的准确度有无显著性差异。,1. 检验法 (1)计算两个样本的方差S 2 (2)计算值:,2. t 检验法分析方
10、法准确度的检验系统误差的判断 (1)平均值与标准值()的比较a . 计算t 值,b . 由要求的置信度和测定次数,查表得到: t表 c . 比较t计与t表 ,若t计 t表 ,表示有显著性差异,存在系统误差,被检验方法需要改进。若t计 t表 ,表示无显著性差异,被检验方法可以采用。,(2)两组数据的平均值比较(同一试样)新方法与经典方法(标准方法)测定的两组数据两个分析人员测定的两组数据两个实验室测定的两组数据 a求合并的标准偏差:,计算值:,查表(自由度f f 1 f 2n1n22),比较:t计 t表 ,表示有显著性差异t计 t表 ,表示无显著性差异,数据的检验解决两类问题: 1. 可疑数据的
11、取舍过失误差的判断,可疑值检验:用数理统计方法检验测定数据是否存在应剔除的值方法:Q检验法和格鲁布斯检验法结论:确定某个数据是否可用,2. 分析方法的准确性系统误差的判断(对照试 验是检查分析过程中有无系统误差的最有效方法),显著性检验:用数理统计方法检验被处理的数据是否存在统计上的显著性差异 方法:t 检验法和F 检验法 结论:确定某种方法是否可用,三、分析结果的质量保证 1. 质量保证和质量控制质量保证是指保证工作质量所必须具备的条件和措施,包括人员素质、实验室仪器设备条件、环境条件及技术管理制度。质量控制是指为保证实验室中得到的数据的准确度和精密度能够落在已知概率限度内所采取的措施。,2
12、. 质量控制图,质量控制图是质量控 制的一种简便有效的 统计技术。,四、变量的均匀化变换,1均值计量变换均值计量变换即用绝对量的平均值作为均匀化因子,去除该变量每个样品的原始观测数据。 2极差变换(又称正规化或规格化变换)极差变换就是将原始数据减去该变量的最小值然后,以极差作为均匀化因子去除 。 3. 标准化变换标准化变换是将每一变量的原始观测值减去平均值,并以该变量的标准差作为均匀化因子去除。,常规地球化学数据处理 数据变换1.标准化变换,地球化学数据处理方法,式中Xij为原始观察值 。为第j变量的算术平均值,Sj为第j变量的标准差。i=1,2,n为标本数,j=1,2p为变量数。变换后的变量
13、其平均数为0,方差为1。各变量处于同一量纲,两个变量在变换前后的相关程度不变。从几何意义上,标准化变换相当于将坐标原点移至重心(平均数)位置。这种变换适合于量纲和数量大小不一的连续型原始数据,如品位数据,岩石化学分析数据等。,常规地球化学数据处理 数据变换2.极差化 (正规化变换 ),地球化学数据处理方法,式中Xij为原始数据;Xjmin为第j变量的最小值;Xjmax为第j变量的最大值。i=1,2n为标本数;j=1,2, p为变量数。变换后数据处于统一量纲,其最大值为1,最小值为0,所有数据变化在01之间。变换前后变量间相关程度不变,其几何意义相当于把坐标轴原点移至变量最小值的位置。适合于量纲
14、和数量大小不一的连续型原始数据的变换。,常规地球化学数据处理 数据变换3.均匀化,地球化学数据处理方法,式中Xij为原始数据,为第j变量的平均数。所以,均匀化变换亦是为了统一量纲,将原始数据变换为都在1附近的相对数值。变换后的某一变量的数学期望为1,而变量与平均数之差的期望为0。此变换适合于比例变量,如长度 、体积、质量等数据。,常规地球化学数据处理 数据变换4.对数变换,地球化学数据处理方法,其中c为常数。变换适用于服从对数正态分布的数据,由于这类数据分布是最偏斜的,很肯能出现近零的值,当取对数时,这些值可能呈大的负值,为了避免这个缺点,故在取对数前首先对所有数据加上一个常数c。,常规地球化
15、学数据处理 数据变换5.阈值化,地球化学数据处理方法,其中:i=0,1,2,n 划分的级次数,ki为阈值。将原始的观测数据xi按照给定的阈值ki转化为0至n的多元状态;转化后的f(xi)为0,1,2,n的分级,并且无量纲表示,常用于变化范围较大的数据和图形化。,常规地球化学数据处理 数据变换6.其他变换,地球化学数据处理方法,反正弦和反余弦变换 平方根变换 双曲变换 幂函数变换 指数函数变换 等。,第三节 背景值和异常下限值的确定,一、图解法 1剖面图解法,第三节 背景值和异常下限值的确定,一 图解法2 直方图法,Mo的横坐标值,即为所求的背景值c。(或背景值的对数值)。 由频率(或频数)的极
16、大值的0.6倍处,作一平行横坐标的直线,与曲线一侧相交,其横坐标长度即为均方差Sx。由Mo向右量取23倍的Sx,该处所指示的含量(或其对数值)即为异常下限值(或其对数值)。,第三节 背景值和异常下限值的确定,一 图解法 3概率格纸图解法,概率格纸图解法也是建立在元素在地质体中呈正态分布(或对数正态分布)的基础上的。,直线的斜率即为均方差 累计频率50处与频率曲线交点的横坐标(中位数Me)即为背景值C0(或背景值的对数值lgC0)。累计频率84.1或15.9与频率曲线的交点的横坐标与中位数的差值即为Sx(或其对数值),以累计频率97.7处在横坐标上的对应值为异常下限(或异常下限的对数值)。,第三
17、节 背景值和异常下限值的确定,二、计算法这种方法确定背景值和异常下限值也是建立在地质体中元素呈正态分布(或对数正态分布)的基础上。它是通过计算来确定背景值和异常下限值,以均值或众数值来代替背景值,以高出背景值的23倍为异常下限值。,有效数字及其运算规则,一、有效数字:指实际上能测量到的数字。 有效数字 = 各位确定数字 + 最后一位可疑数字。1实验过程中常遇到两类数字: (1)表示数目(非测量值):如测定次数;倍数;系数;分数 (2)测量值或计算值。数据的位数与测定的准确度有关。 记录的数字不仅表示数量的大小,还要正确地反映测量的精确程度。,结果 绝对误差 相对误差 有效数字位数0.32400
18、 0.00001 0.002% 50.3240 0.0001 0.002% 40.324 0.001 0.2% 3,2数字零在数据中具有双重作用: (1)若作为普通数定使用,是有效数字如 0.3180 4位有效数字 3.18010 -1 (2)若只起定位作用,不是有效数字。如 0.0318 3位有效数字 3.1810 -2 3改变单位不改变有效数字的位数: 如 19.02mL为19.0210 -3 L 4注意点 (1)容量器皿;滴定管;移液管;容量瓶;4位有效数字 (2)分析天平(万分之一)取4位有效数字 (3)标准溶液的浓度,用4位有效数字表示: 0.1000 mol/L (4)pH 4.3
19、4 ,小数点后的数字位数为有效数字位数 对数值,lgX =2.38;lg(2.4102),有效数字的运算规则 1. 加减运算:几个数据相加或相减时,它们的和或差的有效数字的保留,应依小数点后位数最少的数据为根据,即取决于绝对误差最大的那个数据。,2. 乘除运算:,几个数据的乘除运算中,所得结果的有效数字的位数取决于有效数字位数最少的那个数,即相对误差最大的那个数。,例:( 0.0325 5.103 )/ 139.8 = 0.00119,相对误差:0.0325 0.0001/0.0325 100% =0.3% 5.103 0.001 /5.103 100% =0.02% 9.8 0.1 /139
20、.8 100% =0.07%,3整化原则:(在取舍有效数字位数时,应注意以下几点) (1)在计算中,经常会遇到一些分数、整数、倍数等,这些数可视为足够有效。 (2)若某一数据第一位有效数字等于或大于8,则有效数字的位数可多算一位。如:9.98,按4位算。 (3)在计算结果中,可根据四舍五入原则(最好采用“四舍六入五留双” 原则)进行整化。 (4)有的浓度计算中,一般保留二位或三位有效数字。pH值的小数部分才为有效数字,一般保留一位或二位有效数字。例如,H+=5.210 -3 molL-1 ,则pH = 2.28 (5)表示误差时,取一位有效数字已足够,最多取二位。,地球化学研究的主要内容,元素
21、异常与空间特征分析研究表达元素异常方式及相关联的元素及元素组合的特征,异常的空间展布特征等 单元素异常单元素异常是指仅依据一种元素的含量(或经变换后的参数)指标所确定的异常,其异常名称可表述为某元素的某类异常。组合异常 组合异常是指将在成因上性质相似、在空间上有关的一组元素,对各个单元素异常进行空间套合所形成的叠加异常。异常元素的组合,可能反映了一定的矿化类型。,元素异常与空间特征分析 综合异常 综合异常是指将在成因上性质相似、在空间上含量分布规律相一致的一组元素,对各个单元素异常采用逻辑或的方法进行异常范围的空间叠加所形成的异常 异常几何特征 异常几何特征是指异常在二维平面空间所呈现的几何轮
22、廓特征,主要包括异常长度、异常走向、异常宽度、异常面积、异常形态等特征参数 线状异常:异常长度/异常宽度10带状异常:异常长度/异常宽度=10-3面状异常:异常长度/异常宽度=3-1,主要内容,元素异常浓度特征异常浓度特征是指形成异常的指标在异常区域范围内的数值特征,主要包括异常下限、异常特征值、异常强度、异常衬度、富集系数、异常浓度分带等特征参数。 异常下限区域地球化学异常是相对于区域地球化学背景而言的。区域地球化学背景不是一个确定的含量值,而是一个含量范围,将背景含量范围的最大值称为背景上限,当元素含量(或其他指标数据)超过区域背景上限时称其为异常,因此异常下限就等于背景上限。 异常特征值
23、异常特征值是异常区域内数据的描绘统计参数量,主要包括中位数、算术平均值与标准离差或几何均值与几何标准离差。,主要内容,研究内容,元素异常浓度特征变异系数反映区域内数据的变化程度,区域内标准差/平均值。 异常强度异常含量的高低或异常含量超过背景值的程度。可以用异常的峰值、平均值、衬度等表示。异常元素分带特征异常分带指地球化学异常在空间上存在的指标之间或同一指标在量值上有规律的演变的现象。,元素异常浓度特征异常规模NAP表征异常面积大小与强度的综合性参数。 浓度梯度在地球化学分散晕中,元素含量(由高到低)对距离的变化率 异常衬度异常内元素平均含量与背景值之比 富集系数各种风化产物中元素含量与其在母
24、岩中含量的比值。异常浓度分带根据异常元素含量变化,在空间上划分的若干连续的浓度区间。,研究内容,异常内部结构分析研究元素异常的内部结构,即异常的浓集度,浓集中心的相对位置和异常的密集程度分析等。 异常内部结构(各浓度带异常形态的一致性)研究异常内是否存在浓度分带,是多个浓集还是单个浓集带,且浓集带的规模形态是否一致等特点。 异常浓集中心数量及在异常内的相对位置浓集中心指异常含量相对富集的部位,对于多个浓集中心,确定其浓集中心数目和它们之间的相对位置。 异常梯级带特征(构造分析)描述异常等值线的稀密程度,可确定不同地质单元的分界线或构造的特征线。 异常组分分带及其原生特点根据异常内组合异常特征及
25、组分分带,可判断矿与成矿异常、成矿类型、可能的成矿期次、成矿系列以及剥蚀程度。组分分带清楚,不同组分的异常中心沿一定方向变化,而且相隔的距离较大,表明成矿作用时间相对较长,可能是有利于不同期次成矿元素富集的指示标志。,研究内容,元素叠加分析研究异常区内元素间的比值特征,确定成矿元素元素的迁移与富集成矿的印迹。常量元素含量及比值Al/Si、K/Na、Ca/Si、Mg/Fe 异常区元素对比值Cu/Mo、Ag/Mo、AgPbZnCd/WSnMoBi、AsSb/PbZn、PbZn/MoW、Cd/Zn等。 元素的累加、累乘用一组特征指示元素的含量规格化后进行累加、累乘,并绘制组合异常图。,研究内容,成矿
26、地质背景地球化学分析通过地球化学元素异常、组合、处理信息及空间特征的分析,研究成矿的地质背景和地质作用等因素。 地球化学地理景观 根据自然地理景观条件和表生地球化学作用划分出影响地球化学异常分布的各种景观区域。 地质背景的地球化学分析研究地质背景的地球化学响应和特征,依据地球化学资料,对异常区内地质背景进行描述。 岩性特征地球化学分析不同的岩石类型有不同的元素分配特征,依据这一特点,可划分出不同的成岩元素序列。 地层含矿性(或矿源层) 的地球化学分析含矿地层和矿源层一般都具有某些成矿元素及伴生元素的高含量,可根据已知含矿层或矿源层异常元素组合及特征,用此类方法在预测区推断地层(或层位)的含矿性
27、或矿源层。,研究内容,成矿地质背景地球化学分析侵入岩类型的地球化学分析 根据不同侵入岩类具有不同的地球化学特征,推断侵入岩类型。 侵入岩特征及与成矿关系的地球化学分析某些与成矿有关的侵入岩含有一些特征元素,在此基础上研究它们与成矿的关联性。 接触关系的地球化学分析某些岩体与围岩的接触带上某些元素分布出现明显的差异(接触带内接触带和外接触带),据此可对接触带类型和关系进行分类。 原岩主要元素成分的地球化学研究通过元素演化规律可推断原岩成分,有时可通过反映原岩的特征元素对原岩加以辨别,如桂东粤西受变质前寒武系岩系的对比就是通过特征元素的研究进行的。,研究内容,地质构造的地球化学研究通过研究元素或元
28、素组合的地球化学空间特征,及元素组合的规律性分析,描述地球化学推断地质构造,尤其是与成矿有关的成矿构造。区域地质构造类型、构造特征(走向、延伸、规模)、构造岩性 用于推断的地球化学标志指用以推断某些地质要素某些特征时所采用的地球化学依据,如,地球化学元素异常组合、高、底背景分布特征、单个异常的形态与一组异常的排列及展布方向、范围等。 区域地质构造类型(如陆块区地质构造、造山带构造、矿带和矿田构造等) 地质构造类型的地球化学分析是指通过对研究区区域地球化学背景场及异常场的分布形态、展布方向等特征的分析,判断研究区所属的可能区域地质构造类型。,研究内容,元素成矿特征分析原岩主要元素成分、主成矿元素
29、、伴生元素、指示元素、成矿地球化学特征(富集成矿、及成矿部位的地球化学分析)、区内已知矿床的地球化学特征 (区域地球化学模式)、元素异常与矿田(带)的关联度成矿区带地球化学特征分析本省各成矿带的成矿地球化学背景,区域异常与成矿区带的关联性,各成矿区带的主要成矿元素和指示元素及其异常分布特征,建立识别各类成矿区带的区域地球化学异常模式 矿田地球化学异常特征分析矿田异常与成矿区带异常的关联性,富集成矿部位的地球化学分析,矿田异常(成矿和指示元素)特征与成矿类型和成矿规模,表生地球化学对异常浓度、分布的影响,建立典型矿田地球化学识别模式 已知矿床地球化学异常特征与建模区内不同类型、不同规模、不同剥蚀程度、不同景观区已知矿床的地球化学异常特征,控矿构造、控矿岩体和控矿地层的地球化学标志,矿床异常与区域异常的关联性等,建立典型矿床地球化学找矿模式,研究内容,资源潜力地球化学定量预测分析成矿率、预测深度 (资源潜力预测方法)、预测资源量、预测区分级、潜力评价(基于地球化学综合因素)、已知矿数、推测矿床数、推测矿床规模 地球化学找矿靶区圈定靶区主要找矿矿种和矿床类型,靶区分类 资源潜力定性、定量预测成矿率分析、预测深度、预测资源量、预测区分级、已知矿床数、推测矿床数、推测矿床规模、基于地球化学综合信息的资源潜力评价。,研究内容,