收藏 分享(赏)

ch1样品数据的描述与预处理.ppt

上传人:dreamzhangning 文档编号:3335244 上传时间:2018-10-14 格式:PPT 页数:24 大小:649KB
下载 相关 举报
ch1样品数据的描述与预处理.ppt_第1页
第1页 / 共24页
ch1样品数据的描述与预处理.ppt_第2页
第2页 / 共24页
ch1样品数据的描述与预处理.ppt_第3页
第3页 / 共24页
ch1样品数据的描述与预处理.ppt_第4页
第4页 / 共24页
ch1样品数据的描述与预处理.ppt_第5页
第5页 / 共24页
点击查看更多>>
资源描述

1、实用计算机绘图,1、 数学地质 包括:微积分、线性代数、概率论与数理统计、地质学。2、 SPSS软件的计算与绘图 包括:样品数据的描述与预处理、假设检验、方差分析、相关分析、回归分析、聚类分析、判别分析、因子分析以及时间序列分析。3、 Surfer绘图 包括:Surfer8.0界面环境、创建基本等值线、图形的高级处理、空白文件与边界文件、粘贴与分类粘贴、图形比例尺、表面图形的创建、平面与立体图形的组合与编辑、图形的对齐等。,课 程 内 容,第1章 样品的数据描述与预处理,一、样本的描述 某地区各采样点下水的水质数据如下表,对每个指标分别进行频数分析,数据描述和数据探察,并分析计算结果。, 样本

2、均值,常用统计量:, 样本方差, 样本标准差, 样本k阶原点矩, 样本k阶中心矩, 顺序统计量,设X1,X2,Xn的观察值为x1,x2,xn,从小到大排序得到: x(1),x(2),x(n),定义X(k)=x(k),由此得到的(X(1),X(2),X(n) 或它们的函数都称为顺序统计量.显然X(1) X(2) X(n) 且有X(1)=min (X(1),X(2),X(n), X(n)=max(X(1),X(2),X(n),1) 样本中位数,2) 样本极差,R= X(n)- X(1), 变异系数:实验数据的标准差与平均值之比,记作:Cv。它反映数据相对离散程度大小的特征值,能较客观地反映数据变化

3、程度的大小。在实际工作中,若两批数据标准差相等,而平均值不同时,则一般认为平均值大的那批数据变化程度小,平均值小的变化程度大。 如:甲煤矿区测得5个煤厚数据为2.4,1.9,2.1,2.3,1.8米;乙煤矿区测得5个煤厚数据为1.2,0.6,0.7,0.9,1.1米。 计算其标准差都为0.255米,而甲矿的平均值为2.1米,乙矿为0.9米,则认为甲矿比乙矿煤厚变化小。因为甲矿煤厚平均厚度大,基础雄厚,虽然有与乙矿煤厚同样波动,但无关大局;而乙矿平均厚度小,底子薄,经同样的波动,几乎发生不可采的危险。 利用变异系数来反映这批数据的变化程度:,例.检验两批灯泡的质量,从中分别随机抽样5只,测得使用

4、寿命如下:A: 2000 1500 1000 500 1000; B:1500 1500 1000 1000 1000; (单位:小时),试比较这两批灯泡质量的好坏.,计算得:平均寿命分别为:A:1200,B:1200,观察得:A中使用寿命偏离较大,B中使用寿命偏离较小,所以,B产品质量较好.,数学期望,方差,随机变量的数字特征,数学期望,1.定义:(离散型)设离散型随机变量X的分布律为Px=xn=pn,n=1,2,., 若级数 绝对收敛,则称该级数的值为X的数学期望或均值,记为,EX=,若,非绝对收敛,即级数,发散,则称X的数学期望不存在.,均值,例如:,则,EX=,=-10.2+00.1+

5、10.4+20.3=0.8,注意:数学期望反映了随机变量取值的平均值,它是一种加权平均.,定义(连续型):设X是连续型随机变量,Xf(x),若,绝对收敛,则称该积分值为X的数学期望,记为:,EX=,否则,称X的数学期望不存在.,例如:若X服从a,b区间上的均匀分布,即X,则,EX=,数学期望反映了连续型随机变量的平均取值.,2.数学期望的性质:,(1)E(c)=c; (2)E(aX)=aE(X); (3)E(X+Y)=EX+EY,(4) 若X与Y是独立的,则E(XY)=EXEY,证明:(2)离散型,aX ax1 ax2 . axn .P p1 p2 . pn .,则,E(aX)= ax1 p1

6、+ax2 p2+ .+axn pn+.,=aE(X),连续型:XfX(x),Y=aX,则,Y,不妨设a0,EY=,=aEX,令,几种重要的离散型分布的数学期望,(1)、参数为p的0-1分布:,EX=p;,(2)、二项分布,EX=np,(3)、.Possion分布,概率分布为,EX=,(1) 均匀分布,几种重要的连续型分布的数字特征,称随机变量X服从a,b的均匀分布,记为 XU(a,b),若,EX=,(2) 指数分布,称 r.v.X服从参数为的指数分布,记为XP() (0),若,EX=,证明:,EX=,(分部积分法),注意:,指数分布常用作各种“寿命”的近似分布.,(3) 正态分布,EX= ,,

7、1).一般正态分布,X N(,2),XN(0,1),2).标准正态分布,EX=0,特别,若X1,X2, .Xn独立同正态分布N(,2) ,记:,则,方差,(1)定义(离差):设X为随机变量,EX存在,称X-EX为离差;,显然,E(X-EX)=0.,定义(方差):设X为随机变量,EX存在,且E(X-EX)2存在,则称E(X-EX)2为X的方差,记为:,DX= E(X-EX)2,特别,记,x=,为X的标准差(或均方差).,注意:,方差反映了随机变量相对其均值的偏离程度.,结合随机变量函数的数学期望可得:,(1)若PX=xn=pn,n=1,2,.,则,DX= E(X-EX)2,(2)若X为连续型,X

8、f(x),则,DX= E(X-EX)2,方差的性质:,(1)D(c)=0; (2)D(aX)=a2D(X) (3)D(X+b)=DX (4)DX=EX2-(EX)2,证明:(2)D(aX)=EaX -E(aX)2,=Ea(X-EX)2,=a2E(X-EX)2,=a2D(X),(4),DX= E(X-EX)2,=EX2-2X(EX)+(EX)2,=EX2-E2X(EX)+E(EX)2,=EX2-2(EX)(EX)+(EX)2,=EX2-(EX)2,EX2 = DX +(EX)2,(常用于计算方差),(注:EX是常数),若X与Y相互独立,则D(X+Y)=DX+DY,(6) D(X)=0,PX=E(

9、X)=1,协方差及相关系数,1.定义 设两个随机变量X,Y的期望,方差存在,则称 cov(X,Y)=E(X-EX)(Y-EY) 为X和Y的协方差。,2.性质 cov(X,Y)=EXY-EXEY cov(X,Y)=cov(Y,X) cov(aX,bY)=abcov(X,Y) cov(Z,aX+bY)=acov(Z,X)+bcov(Z,Y) 若X与Y独立,则cov(X,Y)=0 cov(X,X)=DX D(aX+bY )=a2DX+b2DY+2abcov(X,Y)特别 D(XY)=DX+DY2cov(X,Y),一、协方差,3.计算,(1)若(X,Y)为离散型随机向量,PX=xi,Y=yj=pij

10、,(i,j=1,2),则,(2)若(X,Y)为连续型随机向量,(X,Y)f(x,y),则,注意,(1)以上公式是在(X,Y)的联合分布已知情况下应用; (2)一般地,常用计算方法为:cov(X,Y)=E(XY)-EXEY 其中,EX,EY, EXY由定理计算.,二.随机变量的相关系数及其性质,1.定义 设随机变量X和Y的方差为正值,称,为X与Y的相关系数.并且,2.性质,(c )X,Y独立,注意 : X,Y不相关,不一定有X,Y独立.,(b) D(XY)=DX+DY2cov(X,Y)= DX+DY2,XY 0,X,Y为相关 XY=0,X,Y不相关,XY0,X,Y正相关 XY0,X,Y负相关,a

11、0时,XY=1 a0时,XY=-1,证明(e):,cov(X,Y)=E(X-EX)(Y-EY)=E(X-EX)(aX+b)-E(aX+b),=E(X-EX)(aX-aEX),=aE(X-EX)2,=aDX,DY=D(aX+b)=a2DX,故,注意: | XY | 的大小反映了X,Y之间线性关系的密切程度:XY=0时,X,Y不相关,无线性关系;|XY|=1时,X,Y之间具有线性关系.,一、矩,1.原点矩:对于正整数k,若E(Xk)+,称Exk k=1,2,.,为 随机变量X的k阶原点矩,简称k阶矩.,2.中心矩:对于正整数k,若E(X-EX)k+,称E(X-EX)k k=1,2,.,为随机变量X

12、的k阶中心矩.,注: EX和DX分别是一阶原点矩和二阶中心矩.,矩、协方差矩阵,3.混合原点矩:对于正整数k,l,若EXkYl+,称EXkYl k,l=1,2,.,为 随机变量X和Y的k+l阶混合原点矩。,4.混合中心矩:对于正整数k,l,若E(X-EX)k(Y-Y)l+,称E(X-EX)k(Y-Y)l 为 随机变量X和Y的k+l阶混合中心矩,二. 协方差矩阵与相关系数矩阵,定义1.设(X1,X2,X n)的各分量方差存在,称n阶方阵V为协差矩阵,其中Vij=cov(Xi,Yj),i,j=1,2,性质 (1)Vij=DXi, Vij=Vji, 即V为对称矩阵,进一步,V为非负定阵;(2)对二维 随机向量(X,Y)有:,事实上,Vii=cov(Xi,Xi)=E(Xi-EXi) (Xi-EXi) =E (Xi-EXi) 2=DXVij=cov(Xi,Xj)= Vji=cov(Xj,Xi), 所以,定义2. 设(X1,X2,X n)的任两个分量Xi和Xj的相关系数ij存在,(i,j=1,2,),称n阶方阵R为n维随机向量的相关矩阵,记为,其中ij为分量Xi和Xj的相关系数.,显然,所以,性质 (1)相关矩阵R主对角线元素均为1,且R为对称的非负定矩阵;(2)对二维随机向量(X,Y)有:,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报