1、2019/4/7,1,2019/4/7,2,重点,2019/4/7,3,31 水文统计的意义及基本概念,本节自学:,2019/4/7,4,4、数理统计法对水文资料的要求是什么,简 介,2019/4/7,5,32 概率与频率,一、概念,1、概率,0 P(A) 1,2019/4/7,6,事先概率,总体是有限的,其随机变量的机率可事先算出,事后概率,经验概率,总体是无限的,其随机变量的 机率无法事先算出,水文统计是事后机率,因为水文特征值是无限总体,2019/4/7,7,2、频率,在若干次重验复实验中,某事件出现的次数与实验总次数之比。,频率是随机实验时的实测值,2019/4/7,8,3、频率与概率
2、的关系,2019/4/7,9,二、概率运算定理,1、概率相加定理:,p(A1+A2+An) = P(A1)+P(A2)+ +P(An),2、概率相乘定理:,p(A1* A2* An) = P(A1)*P(A2)* *P(An),2019/4/7,10,三、随机变量的概率分布,随机变量与其概率的一一对应关系,称随机变量的概率分布。,1、随机变量的概率分布,2、频率及有关概念,表示每组所在区间的变量值出现的可能程度,2019/4/7,11,(2)频率密度,频率在区间内的平均值,即:,(3)直方图,(4)频率密度曲线当x0 时,直方图近乎曲线,此曲线即频率密度曲线。,2019/4/7,12,x,频率
3、密 度曲线,2019/4/7,13,(B)密度曲线形状,见图3.2,多呈铃形(正态)分布,中间值频率较大,两头较小。,2019/4/7,14,四、累积频率与重现期,1、累积频率,等量或超量值的累积频数与总观测次数之比。,是机率相加定理的应用,公式,2019/4/7,15,观测年限越长,则样 本容量越大,其预见性 越可靠。,其中:,2019/4/7,16,观测年限越长,则样本容量越大,其预见性越可靠。,2019/4/7,17,2、重现期, 等于或大于某随机变量 xi 的值,平均多少年 (或多少次)可能遇见一次,简称多少年(或 多少次)一遇。,重现期较累积频率更易懂、具体,2019/4/7,18,
4、其中:T 重现期 p累积频率,对于洪水频率,对于枯水频率,2019/4/7,19,例,2019/4/7,20,五、设计频率标准(简介),2019/4/7,21,1、频率设计标准是根据工程的重要性及建筑物的等级来制定的允许破坏率和安全率,建筑物正常运转遭到破坏的可能性,在年内都能保证安全的机率,2019/4/7,22,2、保证率的计算,PM=(1-p)n,n 越小,保证率越大,即 要求保证的年数越小,可以 达到的保证率越大。,2019/4/7,23,33 经验累积频率曲线,一、经验累积频率曲线,2019/4/7,24,二、经验累积频率公式,1、古典公式:,适用于系列比较长,即 n 很大时,否则
5、p 不合理,故水文计算中一般不采用此种公式。,2019/4/7,25,注意:,2019/4/7,26,2、数学期望公式(维泊尔公式):,3、中值公式(切哥达也夫):,符号的意义同上。常用此公式,2019/4/7,27,4、海森公式:,以上几个公式各有特点,从形式上难以确定哪个更符合实际,因为不管哪个公式都存在一定的抽样误差, 且愈靠近两端,误差愈大,故只有增大样本容量,才能使计算结果更接近实际。实践证明,维泊尔公式的结果偏于安全,且公式形式简单,工程水文中常用此式。,2019/4/7,28,2019/4/7,29,三、经验累积频率曲线的绘制和应用,步骤,2019/4/7,30,四、经验累积频率
6、曲线的外延,由于在实际工程中,往往需要将实测的频率曲线向两端延长,以满足于设计频率标准。但若在普通坐标纸上点绘曲线,由于曲线两端曲率变化较大,如果只凭目测使其延长,则误差太大,故可采用以下的方法:,2019/4/7,31,1、应用机率格纸绘制经验累积频率曲线,一般采用海森 机率格纸,(1)可以使密度曲线为正态分布的分布曲线,在海森机率格纸上呈现一条直线;,(2)由于实测水文资料系列,其密度曲线很少呈现严格的正态分布,故此分布曲线也并非一 条完全的直线,外延仍有一定的误差。,特点,2019/4/7,32,2、利用数学方程式(即理论累积频率曲线),对水文资料的频率密度曲线选配 一条合适的数学模型,
7、利用数学的 方法推求累积频率曲线方程式,安全与经济是一对矛盾体,解决问题的办法就是由国家统筹考虑给出的设计频率。,2019/4/7,33,3-4 随机变量的统计参数,统计参数,某些随机事件虽然有共同的统计规律,但不同的系列中,其取值也不同,故描述频率分布的密度曲线和分布曲线也具有不同的形状。为了选配合适的密度曲线数学模型,就必须选好合适的统计参数。,在数理统计法中,为描述不同系列的频率分布和曲线形状,所采用的能反映其特征的几个具体数据。,2019/4/7,34,水文统计常用的几个统计参数:,与系列中所有变 量有关,反映系列变量平均水平的参数,是系列量的代表。,2、计算:,一、均值,2019/4
8、/7,35,如: 有一实测系列: x1 ,x2, x3,xn ,相应的频数是: f1, f2, f3 ,, fn 。,则有:,(1)加权平均法,2019/4/7,36,(2)算数平均法:,当各变量占有同等比重(即出现的次数相同)时。,可写为:,2019/4/7,37,二、均方差、变差系数(离散系数),1、均值的数学特性:,2、均方差 s,描述系列各变量的离散程度。可用以比较 系列的均值相同时,其离散程度的大小。,2019/4/7,38,(1)公式:,水文资料应是样本, 故一般应用此式。,n 总数,2019/4/7,39,如:有两系列,甲: 10,50,90,乙: 49,50,51,故若比较系列
9、的 离散程度应考虑均值 和均方差,2019/4/7,40,2019/4/7,41,3、变差系数Cv,均方差与均 值的比,2019/4/7,42,(1)公式,2019/4/7,43,(2) 例:,乙系列:995,1000,1005,甲系列:5,10,15,即:当均方差相同时,均值越小,离散程度越大,2019/4/7,44,(3)影响 Cv 的因素,1 流域形状,2019/4/7,45,2河网的布置,3实测系列时段的长短,同一水文现象,时段长的 Cv 时段短的 Cv,2019/4/7,46,三、偏态系数(偏差系数),1、偏态系数 Cs,衡量一个系列在均值两侧对称程度的参数。,(1)公式:,2019
10、/4/7,47,(2)Cs 对曲线的影响,正偏态分布,正态分布,负偏态分布,2019/4/7,48,35 理论累积频率曲线,理论累积频率曲线,用数学方程式建立起的频率曲线方程,理论累积频率曲线并非是由理论导出的公式,只是 这种数学方程式的特点与水文统计规律能较好的符合,故 此式只是可用以分析水文样本系列的数学工具,不能说明 水文现象的本质。用数学公式可以达到延长经验频率曲线 的目的。而频率曲线的形状与三个参数有关,故要选配合 适的理论曲线,就须先设定好三个参数。,2019/4/7,49,一、皮尔逊型曲线,1、方程:,若将坐标原点定在众值处,可写成:,2019/4/7,50,其中:,众值系列中出
11、现 次数最多的变量。,2019/4/7,51,2、曲线方程中各参数的计算见式 327,3、皮尔逊型曲线的应用,皮尔逊型曲线积分, 可以得到理论累积频率 曲线的随机变量值公式。,2019/4/7,52,是 p、cs 的函数,(1)公式:,其中:,2019/4/7,53,1 皮尔逊型曲线只是一种数学模型,具体应用时应 联系具体的水文现象作分析;,(2)问题:,2019/4/7,54,4、统计参数对皮 型曲线的影响,皮 型 曲线是密度 曲线,2019/4/7,55,(1)均值反映位置变化,2019/4/7,56,(2)Cv 反映密度曲线的高矮情况:,Cv=0 时, 成为一条 垂直横坐标的垂线。,20
12、19/4/7,57,(3)Cs 反映密度曲线的偏斜情况:,因为年最大流 量系列 Cs 无 负值,故曲线 总是峰偏左 (正偏态)。,2019/4/7,58,5、统计参数对理论累积频率曲线形状的影响,2019/4/7,59,(2)cv 的影响:,2019/4/7,60,(3)cS 的影响:,当 cS 23时, 曲线下端水平。,2019/4/7,61,二、克里茨基闵凯里曲线,是水文学中常用的理论频率密度曲线之一,应用条件,2019/4/7,62,此曲线的适应性大,适合于分析我国北方河流的径 流资料。但因此曲线将下限定于零点,与实际不符(最 大流量与年径流量的最小值均不可能为零),故不常 用,常用的是
13、 p 型曲线。,Cs 2时,曲线下端出现 负值,也与事实不符。,2019/4/7,63,36 抽样误差,一、误差来源,由样本的统计参数来代替总体的统计参数,这种抽样引起的误差称为抽样误差。,2019/4/7,64,2019/4/7,65,二、抽样误差概述,1、抽样误差的种类:,2019/4/7,66,1 均方误误差的平均值或平均误差,2 机误凡是使误差落在与不落在它们均方误两侧 (即大于和小于误差均值)各 一 个定值范 围内的机率相等(50%), 则这一定值称机误。,3 最大误差误差理论一般认为,左右一个均方误为一般误差范围;三个均方误或四个机误为误差的极限范围,即最大误差。,2019/4/7
14、,67,由误差理论可知,当误差界限取均值两旁各一个均方差或机误时,有:,由此可知,均方差或 机误是给实际样本以一种 估计其准确性的界限,并 称之为置信区间。置信区间越小,则误差 越小,因而样本的代表 性也越好。,2019/4/7,68,(1)抽样误差的作用:,2、计算,2019/4/7,69,(2)计算:,2019/4/7,70,37 水文频率分析,频率分析,即确定合适的统计参数,在水文计算中,统计参数的正确与否会直接 影响最终的设计值,故应使统计参数尽可能的与 实测资料相符。,经验适线法,p68,2019/4/7,71,一、方法,公式:,1、矩法,2019/4/7,72,2、适线法,矩法与经
15、验累积频率点据相结合,以选配合适的理论频率曲线的方法。,2019/4/7,73,试错适线法,2019/4/7,74,(1)将实测点据点绘在机率格纸上(xp )的关系;,经验累积频率曲线,步骤,2019/4/7,75,(4)据选定的曲线查算 xp 。,(3)将不同 cS 对应的理论曲线同时点绘在经验累积 频率曲线的机率格纸上,找出一条最合适的理论曲线。,例 310,2019/4/7,76,38 相关分析,自然界中许多现象不是孤立的,而是相互之间有一 定的联系,人们在长期的实践中发现,两个变量之间的 关系可以归纳为两大类。,2019/4/7,77,2019/4/7,78,一、相关分析的意义,1、相
16、关分析,对变量之间数量关系的分析,称为相关分析。,2、意义,当某一水文现象资料较短,而与之有关的另一 水文现象资料较长时,可用相关分析法来延长较短的系列或插补缺测的资料。,2019/4/7,79,1、按相关变量的多少可分为:,二、相关分析分类,2019/4/7,80,2、按相关的密切程度可分为:,变量之际的关系非常密切,相互成严格的函数关系。,变量各自独立,互不影响,彼此之间没有关系。,介于以上两者之间,变量之间不是相互独立的,但彼此间的关系也不是非常的密切。,2019/4/7,81,直线相关,曲线相关,统计相关,2019/4/7,82,完全相关,零相关,2019/4/7,83,1、相关图解法
17、,三、简单直线(线性)相关,2019/4/7,84,(1)目估法,在点据中心且过均值绘一条直线,两侧点据的正负离差大致相等。,2019/4/7,85,(2)*两点平均定线法:,步骤:,2019/4/7,86,方程式:,(5)通过a、b两点连成一直线,即 y 依 x 变回归直线。,(4)将实测点据与平均值点据点在同一坐标纸上;,2019/4/7,87,(3)*多点平均定线法,步骤:,2019/4/7,88,2、相关分析法,(2)回归线,将两系列的随机变量对应值点绘在坐标纸上,若点据的分布趋势呈直线,则证明两系列的变量之间存在直线相关,可通过点据配合一条最佳的直线,此直线称变量之间的回归线。,20
18、19/4/7,89,(3)回归方程,描述回归线的方程式称变量之间的回归方程,348式,2019/4/7,90, y i2 =最小,x, x i2 =最小,2019/4/7,91,3、相关系数和回归系数,(1)相关系数:,计算式:,2019/4/7,92,(2)回归系数,见 p75, 回归系数,y 依 x 变回归,2019/4/7,93,在统计相关的计算中,因两变量之间 不是函数关系,回归线也只是实测点据的 最佳配合线,故相关分析也存在误差。,4、相关分析的误差,2019/4/7,94,(1)回归直线误差( y 依 x 变回归 ),349式,(n-2)相当于自由度,当只有两个测点时, 直线必过此
19、二点,无误差;若有三个点,会出 现点线之间的离差,此是因多一个点据所造成 的;若有n个点据,则认为将有(n-2)个点 引起误差。,2019/4/7,95,2机误,3回归直线误差的几何意义,最大误差范围可认为是 3sy 或 4Ey。,2019/4/7,96,2019/4/7,97,(2)相关系数误差,计算式:,351式,352式,2019/4/7,98,5、相关分析时应注意的问题,(1)观测项数 n,n 应有一定的长度,以减小误差,一般的 应不少于1015项。,(2)判别相关的可靠性,总体不相关的两个变量,由于抽样的原因, 不一定为零。,2019/4/7,99,(1)可用 sy或 Ey 来判别,t 检验法样本相关系数分布变成另一变量 t 的分布。,(2)*采用统计检验法来判别。,2019/4/7,100,如图:若计算的值位于A、B区(A、 B面积共占 k %),即:,2019/4/7,101,有 n =12年的观测资料,得=0.88,若取信度=0.05,则查有 关表格可知:=0.58。 ,判定总体相关,但失误 的可能性是 5%。,举例:,在水文统计中常选=0.05。,