1、1,第八章 蒙特卡罗模拟法,1 蒙特卡罗法概述,2 随机数及其产生方法,3 随机变量的抽样,4 油气资源量的估算,5 地质风险分析,6 应用简例,2,1 蒙特卡罗法概述,蒙特卡罗法(Monte Carle):以数值解不确定问题为对象,对计算模型中的各变量进行随机抽样(随机试验),进而求问题概率解的一种统计学方法。因此,蒙特卡罗法又称为统计试验法。,蒙特卡罗法是以概率论与数理统计理论为指导的、有着广泛应用领域的通用性统计学方法,其核心是对随机变量的抽样。常用于油气资源量预测。,美国第二次全美石油资源评价的主要方法就是蒙特卡罗法。目前各主要产油国及各大石油公司都把该法作为油气资源评价的重要方法之一
2、。,3,如何利用蒙特卡罗法进行油气资源量的计算?在概念模型清楚的基础上,首先要构造表示所研究问题概率解的数学模型(计算模型)。,我国1979年把蒙特卡罗法用于油气资源评价,该方法目前仍是我国预测油气资源量的常用方法之一,也是以统计预测为主的应用软件评价系统的核心算法之一。,对一个实际地区的油气资源总量而言,它是各局部含油气地质单元油气资源量之和。而局部含油气地质单元既可以是生油凹陷中的一个生油层系,也可以是次一级构造单元中的生油层系,还可以是局部构造等。,4,(8-1),油气总资源量:,Qj -第j个局部地质单元油气资源量( j=1,2, m);Xjl -第j个局部地质单元第l个地质变量;cj
3、 -第j个局部地质单元中v个地质常数Di之积。,虽然“局部地质单元”含义不同,但任何一个局部含油气地质单元的油气资源量都可归纳为与油气资源量相关的地质常数和变量的乘积,即:,因此,求油气资源量的问题,就归结为求上述两个计算模型的概率解问题。,(8-2),5,一、蒙特卡罗法的基本思想,蒙特卡罗的基本思想可概括为:为求研究问题的概率解, 构造一个表示所研究问题概率解的数学模型(计算模型),记为:,(8-3),依据计算模型中各随机变量Xi所服从的分布进行随机抽样,并按计算模型计算Y的多个估计值,最终用频率统计法求出Y的概率解。,方法的核心是随机抽样,而随机抽样的关键在于产生0,1区间上均匀分布的随机
4、数。因为服从其它分布的随机数一般可通过该随机数变换得到。,6,二、蒙特卡罗法求解的基本过程,由基本思想,求解过程大致分为四步:, 分析并拟定给定问题中的随机变量,构造表示给定问题概率解的数学模型;,对模型中的随机变量X1, X2, Xn各进行L次随机抽样,获得L组抽样值:,x1k , x2k , xnk (k=1,2, ,L),把L组抽样值代入计算模型,求出随机变量Y的L个估计值Y1 , Y2 , , YL;,利用频率统计法,由Y的估计值Y1 , Y2 , , YL求出描述Y分布特征的分布曲线(概率解) ,如图8-1。,7,图8-1 随机变量Y的分布曲线,8,2 随机数及其产生方法,一、随机数
5、,随机数是随机变量的观测值,由其构成的数据序列叫做随机数序列,它是一个无周期的数据序列。蒙特卡罗法需要对变量进行数以千计、万计、甚至是百万计的抽样,这在实现过程中几乎是不可能的。因此考虑用计算机模仿实际抽样过程,形成一个有周期的抽样数据序列。称这种数据序列为“伪随机数”序列,其中的元素叫做“伪随机数”。伪随机数显然不是真正意义下的随机数,即这种抽样值并非是随机变量的真实观测值。,9,尽管如此,只要对伪随机数序列进行一系列严格的统计检验,证明它可以满足统计的要求,则伪随机数就可以做为真随机数使用。,为了满足抽样问题的需要,在计算机上产生的伪随机数序列不仅要有足够长的周期,而且应当具有符合要求的概
6、率统计性质。从理论上讲,只要有一种连续分布的随机数,就可以采用数学变换的方法产生其它分布的随机数。0,1区间上均匀分布的随机变量的抽样值是最简单、最基本的一种连续分布的随机数,其它分布的随机数都可以借助它来产生,所以说:0,1均匀分布随机数技术是实现随机抽样的最基本工具。,10,xn , xn+1第n次和第n+1次产生的伪随机数;-乘子系数;M- 模;rn+1- 0,1区间上的伪随机数。xn+1xn (mod M)叫做以 M 为模的同余式,表示xn+1取值为:与xn的积除以 M 的余数部分。,该方法产生伪随机数序列的递推同余式为:,二、伪随机数的产生方法1. 乘同余法,11,2. 混合同余法,
7、该方法产生伪随机数序列的递推同余式如下:,混合同余法比乘同余法仅是增加了一个增量,其它含义与乘同余法相同。,如:M =219 = 524288 , = 55 = 3125 时,x0= 23 , 11 ,19 , 37;= 3 , 7 , 11 , 17分4套配合使用,混合同余法可产生周期为524288伪随机数序列。,注:所获得的伪随机数是否能代表真正意义上的随机数,还需进行检验(检验方法略)。,12,一、随机变量的经验分布函数,在概率论中,随机变量X的分布函数是随机变量X的取值不大于实数 x的概率。通常记为:F(x)=P(Xx),图8-2 随机变量分布曲线,如图8-2所示。,3 随机变量的抽样
8、,对随机变量的抽样,有经验分布函数抽样法、直接抽样法和变换抽样法等。在此仅介绍经验分布函数抽样法。,13,经验分布函数是由X的 n 个观测值x1, x2, xn ,用统计方法得到的分布函数,记为Fn(x) 。,如图8-3。,但是,在油气资源评价中,人们总希望得到资源量不小于某个实数 x 的概率P(Xx), 显然:,P(Xx)=1-P(Xx)=1-F(x),图8-3 分布函数曲线,14,(8-4),以统计所得的Fn(x)代替F (x), 并记:,AF(x)就是油气资源评价中的经验分布函数。,二、随机变量经验分布函数的构造方法,频率统计法构造经验分布函数的条件及步骤:,(1)使用条件:随机变量必须
9、有观测值, 且个数足够多(如30)。,(2)构造分布函数的步骤,确定频率统计区间数要将n个观测值所在的大区间划分为k个小区间 ,一般n/k3 ,且k最好为奇数。,15, 计算区间端值将(xmin , xmax) k等分, 各小区间的k+1个端值为:,其中xmin , xmax是观测值的最大和最小值。, 经验分布函数记ni 为观测值落入区间(x i , xi+1)内的频数(个数), fi 为累加频率,则,显然 f1=1.0 , fk=nk/n , f1 f2fk,n=n1 +n2 +nk,16,图 8-4 累计频率直方图,17,图8-5 经验分布函数曲线,经验分布函数表示为:,18,将坐标原点设
10、为(xmin ,0),若已知0,1区间上均匀分布的随机数ri ,则在图8-6纵轴上可确定点(xmin , ri ), 过该点作横轴的平行线交分布曲线于点(xi , ri ), xi 则是对应于随机数 ri的一次随机抽样值。,三、经验分布函数的抽样,由此可得随机变量的一系列抽样值。称该抽样方法为经验分布函数抽样法。,图8-6 分布函数抽样过程示意图,19,如前所述,局部含油气地质单元是估算资源量的基本地质体。对第j个局部地质单元来说,其油气资源量的通式为:,4 油气资源量的估算,一、局部地质单元资源量概率模型,式中: Qj -第j个局部地质单元的油气资源量;Xji -第j个局部地质单元第i个地质
11、随机变量;cj -第j个局部地质单元中所有常数之积。,20,二、资源量的计算1. 最大最小可能资源量及累计频率区间间隔值为了求资源量的分布曲线,在资源量计算之前,先求出资源量的最大、最小可能值和累积频率小区间的端值:,最小可能值:,式中k是小区间个数。,最大可能值:,区 间 端 值:,21,对n个随机变量Xji (i=1,2,n)各进行一次抽样 ,得第一次抽样值xji1 (i=1,2,n),由第一次抽样值的积得到资源量的第1个估计值,即:,2. 资源量的计算,对随机变量 Xji (i=1,2, n)再各进行一次抽样,得第二次抽样值xji2 (i=1,2,n),由第二次抽样值的积得到资源量的第2
12、个估计值,即:,22,按上述做法,可得:,第 j 个局部地质单元的资源量的分布函数 根据区间间隔值,用频率统计的方法求出Qj的分布函数AF(Qj),如图8-7。,图 8-7 资源量分布函数,23,图8-8 油气资源量的概率加示意图,三、总资源量,总资源量是局部地质单元资源量的概率加(对各资源量分布函数的随机抽样加)。,资源量概率加的大致过程如下图:,总资源量的分布函数,24,四、估算资源量的基本过程,对于一个局部地质单元:,选择预测(估算)方法(建立概率估算模型);,确定参数中的随机变量;,构造随机变量的分布函数;,对各随机变量的分布函数进行重复抽样,计算出资源量的多个估计值;,由资源量的多个
13、估计值求资源量分布函数。,对于m(m1)个局部地质单元:,需要概率加求总的资源量(局部地质单元资源量分布函数是求总资源量的基础)。,25,Q的经验分布函数(概率解),26,由于石油勘探的未来成效具有不确定性,因而需要对估算的石油资源量进行风险分析。石油勘探中的风险是多种多样的,如勘探区是否具备形成油气藏的地质条件的风险;在具备形成油气藏地质条件的含油气区内,能否找到一定规模油气藏的勘探风险;勘探后发现的油气藏是否具备开采价值的经济风险;勘探过程中人与设备是否安全的风险;对于勘探地区,特别是大陆架地区是否有国际争议的政治风险等。,5 地质风险分析,一、风险分析,27,油气资源评价为油气勘探提供决
14、策依据,而油气资源估算是资源评价的组成部分。因此,要对上述风险下估算的油气资源量做好地质风险分析。,地质风险分析是指对模型中的参数做进一步的深入研究,对各参数存在的可能性做出概率估计,在此基础上对预测的资源量进行可靠性分析。,实际工作中,地质风险分析可以在不同的层次进行,如单一地质圈闭的风险分析,一组地质圈闭的风险分析(国外对地质条件相似的一组地质圈闭称作一个勘探层),一个油气聚集带的风险分析,整个含油气盆地的风险分析等。,地质风险分析大多从圈闭开始进行,其风险的计算公式为:,28,式中K是圈闭的风险值, ki是第i个因素的风险值。例如,若用容积法估算圈闭的石油储量,则有:,对储量进行风险分析
15、,要由熟悉工区的地质人员对上述5项参数的风险逐个分析论证。通常来说:,Q-石油储量 S-含油面积 H-储层厚度 -储层孔隙度 D- 石油充满系数 W- 采收率,29,S(含油面积)的风险决定于地质调查或地震勘探资料的可靠性;,的风险决定于储集层孔隙是否有次生改造或后期充填的影响;,H(储层厚度)的风险受岩性岩相变化的影响;,D(充满系数)的风险受生油岩的成熟度和油气运移通道的制约;,W(采收率)的风险与原油性质及驱动类型有关。,对每个参数的风险值k(0k1),目前尚无完善的方法确定。一种方法是由地质人员凭经验指定;另一种方法是借用地质条件类似的邻区风险值。如某地质圈闭经风险分析论证后给出如下风
16、险值:,30,根据表内数据,计算该圈闭的风险系数为0.65,而保险值为0.35,即经过风险分析后该地质圈闭的石油储量的可能性仅是风险分析前的35%。,表8-1 某个地质圈闭风险值,31,图8-9 风险分析前后石油储量关系,32,若第j个局部单元油气资源量分布函数为AF(qj),地质风险值为kj ,保险值为1-kj,则需重新估算风险分析后的油气资源量。既在原分布函数基础上再次抽样,入口值区间由0,1变为0 ,1-kj,如图。,图8-10 风险分析前后石油储量关系,二、风险分析后资源总量的估算,33,将0,1上分布的随机数rs改造为0,1-kj上分布的随机数rs*的变换公式为rs*=(1-kj )
17、rs。然后进行随机抽样,求出风险分析后局部单元油气资源量的值:,求得qj(=1,2, N )后,可用频率统计法求出各局部单元的资源量分布函数AF(qj)( j=1,2, m),最后再利用“抽样加”和“频率统计法”求出地质风险分析后资源总量的分布函数AF*(q) 。,AF*(q)=AF(q2)+AF(q2)+AF(qm),qj(=1,2, N ),34,6 应用简例,某沉积盆地中的一个地质凹陷有三套生油层系。用氯仿沥青法估算该凹陷的远景石油资源量,各层系的石油资源量估算公式如下:,Qj - 第j( j=1,2,3)套生油层系的石油资源量;Sj - 生油岩的分布面积; Hj - 生油岩的厚度;D
18、- 生油岩密度; Aj - 生油岩氯仿沥青含量k1 - 排烃系数; k2 - 聚集系数,35,凹陷石油资源量为三套生油层系资源量的和。三套生油层系的地质参数见表8-2。,表8-2 三套生油层系的地质参数,36,第一套层系氯仿沥青分布密度,第一套层系氯仿沥青分布函数,第一套层系厚度分布函数,第一套层系厚度分布密度,第一套层系石油资源量分布函数,37,第二套层系氯仿沥青分布函数,第二套层系氯仿沥青分布密度,第二套层系厚度分布函数,第二套层系厚度分布密度,第二套层系石油资源量分布函数,38,第三套层系氯仿沥青分布函数,第三套层系氯仿沥青分布密度,第三套层系厚度分布函数,第三套层系厚度分布密度,第三套
19、层系石油资源量分布函数,39,第一套层系石油资源量分布函数,第二套层系石油资源量分布函数,第三套层系石油资源量分布函数,凹陷石油资源总量分布函数,=,+,+,40,生油层位及资源量,表8-3 各生油层及全凹陷石油资源量汇总表,41,本章复习要点 1. 蒙特卡罗法的概念及概率解的表达形式; 2. 形成0,1区间上伪随机数的两种方法 ; 3. 随机变量经验分布函数的形成; 4. 随机变量的抽样法种类及经验函数抽样法; 5. 地质风险分析及考虑风险后的经验分布函数; 6. 估算一个地区油气资源总量的一般步骤; 7. 实际应用。,42,思考与练习题 1. 简述蒙特卡罗法的基本思想及过程。 2. 对随机变量进行随机抽样时,为何要产生0,1上的随机数? 3. 如何构造地质研究中随机变量的经验分布函数?它与概率论中随机变量的分布函数有何不同? 4. 估算油气资源量时,如何实现对随机变量的随机抽样?常用的抽样方法有几种? 5.蒙特卡罗法估算油气资源量比传统估算方法有何优点? 6. 应用蒙特卡罗法求数值解不确定问题概率的基本过程是什么?,43,END,