算法合集之《信息学竞赛中概率问题求解初探》.pdf-道客多多

资源描述

1、 IOI2009 冬令营论文梅诗珂 1 走进概率的世界信息学竞赛中概率问题求解初探安徽省合肥一中梅诗珂摘要信息学中许多算法的设计都与概率有关。信息学竞赛中求概率或期望的问题也占有相当的分量，并且具有较大的难度。本文应用组合数的性质、误差分析、补集转化和函数分段等方法和技巧，求解了四个例题，从而总结了概率问题的一般特点与对应策略。关键字概率，随机变量，连续，离散，概率密度，积分目录摘要 1 关键字 1 目录 . 错误！未定义书签。正文 2 1 基础知识 2 1.1 样本空间、事件和概率 . 2 1.2 随机变量 . 2 1.2.1 离散型随机变量及其概率分布

2、. 3 1.2.2 连续型随机变量及其概率分布 . 3 1.3 数学期望 . 3 1.3.1 离散型随机变量的数学期望 . 3 1.3.2 连续型随机变量的数学期望 . 3 1.4 积分 . 3 2 关于离散型随机变量的问题 4 2.1 例一 LastMarble . 4 2.2 例二 Randomness 6 3 关于连续型随机变量的问题 8 3.1 例三 RNG . 8 3.1.1 方法一 . 8 3.1.2 方法二 10 3.1.2 比较两种方法 11 IOI2009 冬令营论文梅诗珂 2 3.2 例四： Random Shooting . 12 4 总结 . 16 感谢 . 16

3、参考文献 16 附录 . 16 附录 1 区域体积的表示 16 附录 2 例三方法一中区域体积公式的证明 . 17 附录 3 论文原题 17 正文 1 基础知识 1.1 样本空间、事件和概率样本空间 S 是一个集合，它的元素称为基本事件。样本空间的一个子集被称为事件，根据定义，所有基本事件互斥。概率：如果有一种事件到实数的映射 P，满足： 1）对任何事件 A， PA 0 2） PS=1 3）对两个互斥事件， PA B=PA+PB 则可称 PA为事件 A 的概率。上述三条称为概率公理。 1.2 随机变量如果对样本空间 S 中的任意事件 e，都有唯一的实数 X(e)与

4、之对应，则称 X=X(e)为样本空间 S 上的随机变量，其中离散型随机变量与连续型随机变量较常见。 1.2.1 离散型随机变量及其概率分布取值范围为有限或无限可数个实数的随机变量称为离散型随机变量。设离散型随机变量 X 取值 xi时的概率为 pk (k=1,2, ),则称 X 的所有取值以及对应概率为 X 的概率分布，记做 PX=xk = pk （ k=1,2,）。常见的离散型随机变量的概率分布有两点分布，二项分布，几何分布，超几何分布，泊松分布。 1.2.2 连续型随机变量及其概率分布如果 X 是在实数域或区间上取连续值的随机变量，设 X 的概率分布函数为

5、 F(x)=PXx，若存在非负可积函数 f(x)，使对任意的 x，有 x dttfxF )()(，则称 X 为连续型随机变量，称 f(x)为 X 的概率密度函数。要注意，概率密度不是概率。常见的连续型随机变IOI2009 冬令营论文梅诗珂 3 量分布有均匀分布，正态分布，指数分布。 1.2.2.1 连续型随机向量及其概率分布如果 X1,X2, ,XN 都是连续型随机变量，则称 (X1,X2, ,XN)为 N 维随机向量，其概率分布函数为 F(x1,x2, ,xN)=PX1 x1,X2 x2, ,XN xN。若存在非负可积函数f(x1,x2, ,xN)使得 D NNN dxdxd

6、xxxxfxxxF .), . ,(), . ,( 212121，其中等式右端表示 N 重积分，就称 f(x1,x2, ,xN)是 N 为随机向量 (X1,X2, ,XN)的联合概率密度函数。如果有 X1,X2, ,XN 互相独立，并且分别有概率密度函数 f1(x1),f2(x2), ,fN(xN)，那么)() .()(),. ,( 221121 NNN xfxfxfxxxf 就是一个合法的联合概率密度函数。 1.3 数学期望 1.3.1 离散型随机变量的数学期望设离散型随机变量 X 的分布律为 PX=xk = pk（ k=1,2,） ,若 1 |k kkpx存在，则称 1k kkp

7、x为 X 的数学期望，简称期望，记为 E(X)。 1.3.2 连续型随机变量的数学期望设连续型随机变量 X 的概率密度函数为 f(x),若广义积分 dxxxf |)(|收敛，则称 dxxxf )( 为连续型随机变量 X 的数学期望，记为 E(X)。 1.4 积分积分：设函数 f 在闭区间 a,b上有定义，记区间 a,b的一个分割为(x0=a,x1,x2, ,xn=b)(x00,都存在 0，只要分割满足 | |0 的情况，我们需要定理一：在 red 个红球， blue 个蓝球中先取 a 个球，再取 b 个球，剩余不同颜色的球数的概率分布与先取 b 个

8、球，再取 a 个球所对应的剩余不同颜色的球数的概率分布是相同的。 1 TopCoder SRM 349 div one 1000 IOI2009 冬令营论文梅诗珂 5 证明：这个定理看上去很显然，因为先取 a 个球再取 b 个球应当是与直接取 (a+b)个球等价的，现在我们用代数方法证明。首先证明 )( nbaCCCC a babanb anan 。因为 )(! )!()!()!( !)!(!)!(! )!(! nbaCCba babanba nbanbana annCC a babanb anan 。假设在先取 a 个球，再取 b 个球后，红球被取了 r 个。显然每次取球是互相独

9、立的。所以这种情况的概率是 )()1()1(1111),(01 b ab l u er e darbaab l u earar e dab l u er e daab l u ear e draM i na CCCCCC )( 11),(01 a baaa rbaarba b l u er edrbab l u err edraM i na CCCCCC （应用上面的结论） ba blueredrbabluerredC CC 其中 a1 表示第一次取到的红球数，在第二个等式的右边，因为 a1 a 和 a1 r 总有一个成立，所以等式恒成立。这个等式告诉我们从 red 个红球与 blue 个蓝

10、球中先取 a 个球，再取b 个求，与直接取 (a+b)个球造成的剩余不同颜色的球数的概率分布是完全相同的。所以取球的顺序与最终的结果没有关系。我们设 F(r,b)表示当前有 r 个红球， b 个蓝球的，被事先取走了 removed 个球（不知道它们的颜色），面对这个局面的玩家所能得到的最大胜率。当玩家取走 m个球时，根据定理一，新的局面与玩家先取走 m个球，再让 removed 个球被取走所得到的局面完全一样！但是有一种边界情况要考虑 :由于不能保证 removed r，可能在一些情况下，取走 m个球后，玩家已经输了，而不能进行下面的游戏。要解决这种特殊情况，只需对 F 的定义和

11、动态规划方程略加修改：让 F(r,b)表示当前有 r 个红球， b 个蓝球，被取走了 removed 个球但仍然至少还有 1 个红球的情况下，当前玩家的最大胜率。我们用 Pro(r,b,k)表示有 r 个红球， b 个蓝球，取走 k 个球而红球数仍大于 0 的概率，那么 Pro(r,b,k)= bakra k brakbarCCC0,。我们用递推式求解，显然 Pro(0,b,0) = 0; Pro(r,b,0) = 1; (r0) )1,1,(Pr)1,1(Pr),(Pr kbrobr bkbrobr rkbro 再考虑 (1)，因为 r 个红球， b 个蓝球取走 removed 个

12、球仍有至少 1 个红球的情况，包含了有 (r-p)个红球， (b-q)个蓝球，取走 removed 个球后仍有至少 1 个红球的情况，因此在前IOI2009 冬令营论文梅诗珂 6 者满足的基础上后者满足的概率是),(Pr ),(Pr rem ov edbro rem ov edqbpro 。由此我们得出最终方程。 0),( brF (r+b = removed) mqp m brqbprbrM i nm qbprFCCCre m o v e dbrore m o v e dqbproM a xbrF ),(1(),(Pr),(Pr(),()3,(1(r+bremoved) （ 2） Fred

13、,blue就是我们所求的答案。观察（ 2）式，我们发现它与（ 1）式唯一不同之处只是多乘了),(Pr ),(Pr rem ov edbro rem ov edqbpro ，两个式子的形式惊人的相似，既在意料之外又在情理之中。而如果证明不出定理（ 1），那么解题方法很可能会复杂很多，这也就说明了数学证明对解决概率问题的重要性。下面一个例子，我们将体会到观察的重要性。 2.2 例二： Randomness2 题目描述：有一个随机数生成器能随机返回 1 到 R 的正整数，现在有 N 个事件，要求第 i 个事件的发生概率是iiba ,用该随机数生成器设计一种事件触发装置，使随机数生成器

14、的期望使用次数Exp 尽量少 ,求出 Exp(精确到 1e-7)。约束条件： 2 R 1000 , 1 N 1000 , 1 ai bi=R，我们把 D(i,k)减去 R， D(i,k-1)加 1，则等式仍成立，而 Exp 减小了。同时可以看出，这就是 biai 的 R1 进制表示，所以 D(i,k)的取值是唯一的。为了计算 Exp，我们定义 H(i+1)为第 i 层生成器产生的导致新的生成器使用的返回值个数，定义 H(1)=1，那么iRiH)(就是第 i 层生成器对 Exp 的贡献，我们有 1)(i iRiHExp 至于求 H(i),因为第 i 层生成器中所有导致新生成器使用的返回值

15、的个数，就是第 i层生成器被使用的个数，减去其中所有导致事件的返回值个数，也就是 Nk kiDRiHiH 1 ),()()1(，我们不可能求出所有的 H(i)，也没有必要，因为对所有的 m=2，我们有22 )1()( mmmk kmk k RNRR NRNRR kH 这个式子告诉我们：只要 m足够大，我们可以让 Exp 的误差小到任意程度，而且这个误差减小的速度是很快的。根据题中要求的精度，只要算到第 50 层就足够了。回顾本题的分析过程，我们发现开头对例子的观察是关键，有了对该样例的观察我们才得到了第 i 层随机生成器的概念，接下来的一切就水到渠成了。这告诉我们解决概率问题多

16、从简单情况，特殊情况观察是个不错的选择。这是因为概率问题涉及的状态多，比较抽象，只有多从形象的例子观察规律，才能较好的把握问题的模型，才谈得上解决问题。 IOI2009 冬令营论文梅诗珂 8 3 关于连续型随机变量的问题关于连续型随机变量的问题，信息学竞赛中出现得还不多，可能是由于题目的解决往往要用到积分。但这类题目中积分的技巧一般并不是难点，最多只是用到 Newton-Leibniz 公式而已，所以今后比赛中很有可能出现更多的关于连续型随机变量的问题，解决这类问题的一些思想在其他类型题目中也是有用的。下面我们将结合两道例题谈谈解决关于连续型随机变量的问题的常见思路。 3.1

17、例三： RNG3 题目描述：有 N 个随机数生成器，第 i 个等概率地返回 0,Ri中的一个实数 (1 i N)。问所有生成数的和小于等于 b 的概率是多少 (答案精确到 1e-9)？约束条件： 1 N 10 , 1 R 10(1 i N) , 0 b 100. Ri,b 都是整数。分析：我们首先对题意进行简单地分析。第 i 个随机数生成器返回的值对应着一个随机变量，不妨设为 Xi，那么 Xi 在区间 0,Ri上均匀分布。同时这 N 个随机变量是互相独立的。这些随机变量的和也是一个随机变量，不妨设为 S。我们要求的就是 S 小于等于 b 的概率，记为P(X b)。我们将从几何

18、与代数的角度，用两种方法解决问题。 3.1.1 方法一回忆基础知识部分， N 个随机变量对应着 N 维空间，比较复杂，我们首先从 N 较小的情况观察。当 N=1 时我们把 X1 的取值范围 0,R1看成数轴上的线段， S=X1 x 看成半直线。 P(S x)就是它们的公共部分长度与 R1 的比值。当 N=2 时把 (X1,X2)的取值范围看成平面直角坐标系的一个矩形； S =X1+X2 x 可以看成半平面； P(S x)就是它们的公共部分的面积与矩形的面积 (R1 R2)的比值。当 N=3 时 (X1,X2,X3)的取值范围可看成空间直角坐标系的长方体； S =X1+X2+X3 x

19、可以看3 SPOJ 2002 Random Number Generator 0 x 1RIOI2009 冬令营论文梅诗珂 9 成半空间； P(S x)就是它们的公共部分的体积，与长方体的体积 (R1 R2 R3)的比值。下图是一个例子。一般的，对任意的 N， (X1,X2, ,XN)的取值范围就是 N 维空间中的一个区域， S x 是一个半 N 维空间，它们公共部分的 N 维体积与 (R1 R2 RN)的比值就是 P(S x)。由于 (R1 R2 RN)是一个常数，问题就转化为求公共部分的 N 维体积。不妨记V(a1,b1,a2,b2, ,aN,bN,x)为在 Xi 取值范围为 a

20、1,b1时，它们的和小于 x 的区域的 N 维空间体积。每个变量的取值范围都是有限的，当 N 较大时，区域有很多边，使情况非常复杂。这时我们想到一个常用技巧：补集转化。 0,Ri = 0,+ ) (Ri ,+ ) 那么 V(0,R1,0,R2, ,0,RN,x)就可以用 Xi 取值范围 0,+ )或 Ri,+ )时的小于等于 x 的区域 N 维体积表示了。具体如何表示并不是重点，有兴趣的同学可以参看附录，这里不作展开。现在的问题是当 Xi的取值范围为 0,+ )或 Ri,+ )时的小于等于 x的区域 N维体积怎么求，当 Xi 的取值范围为 Ri,+ )时，用 X i=Xi-R

21、i 替换 Xi,同时把 x 减去 Ri，问题等价，而 X i 的取值范围恒为 0,+ )。那么问题归结为求 V(0,+ ),0,+ ), , 0,+ ),x),经过简单的观察与证明，可以发现其值为 !NxN ，具体的证明参见附录。至此问题全部解决。回顾解题过程，我们从观察 N=1,2,3 的情况入手，把问题归结为求公共部分的 N 维体积，接着通过补集转化和化简把问题归为求 V(0,+ ),0,+ ), , 0,+ ),x)。通过不断的转化，我们对问题的了解越来越深入。 3.1.2 方法二我们仍然从 N 较小的情况观察。当 N=1 时，我们考虑 x 在 0,+ ) 变化的情况， P(

22、S x)可以表示成函数当 N=2 时 )( xSP x/R1 ( 0 x R1 ) 1 ( x R1 ) IOI2009 冬令营论文梅诗珂 10 如图所示， P(S x)就是矩形在直线 x1+x2=x 下的部分 (阴影部分 )的面积除矩形总面积。为了计算直线 x1+x2=x 下的部分，我们用直线 x+y=R1,x+y=R2 把矩形分成 3 部分，在每部分内直线 x1+x2=x 被矩形所截的线段长随着 x 线性变化。我们对每部分求出 P(S x)的表达式回顾 N=1,N=2 的 P(S x)的求解过程，我们发现可以划分若干区间，每个区间的 P(Sx)可以表示为一个关于 x 的多项式，把

23、 x 带入其所在区间对应的多项式中，得到的就是 P(S x)。现在的问题是：如何划分区间？由于 R1,R2, ,RN 都是整数，我们自然提出了猜想： P(S x)在相邻整数区间可以表示成关于 x 的多项式。这个猜想是正确的。下面我们来证明。证明：设 )(xfi 表示前 i 个随机变量的和 Si=X1+X2+ +Xi(也是一个连续型随机变量 )的概率密度函数，我们首先证明， )(xfi 在相邻整数区间能用多项式表示。用归纳法，当 i=1 时，所求就是 X1 的概率密度函数，由于 X1 在 0,R1上均匀分布，根据概率密度函数的定义，易得：显然它们是多项式。设当 i=2,3,

24、,N-1 时猜想都成立，当 i=N 时，因为 X1,X2, ,Xi 是互相独立的，所以前 (i-1)个随机变量的和 1iS 与 Xi 相独立，而 Xi 的概率密度函数就是一个在 0,Ri上取212 2RRx12 22 RRx212 )21()2212( 222 RR RRxRRx x)P(S1(R2R1) IOI2009 冬令营论文梅诗珂 11 iR1 ，其他位置取 0 的分段函数 (跟 )(1xf 类似 ),根据联合概率密度函数的定义，有：任取一个整数区间 L-1， L(L=1,2, )，考虑 Max(0,x-Ri)=x-Ri 的情况，我们发现可以把积分区间这样划分： x-Ri,L

25、-Ri,L-Ri,L-Ri+1, ,L-2,L-1,L-1,x，其中除了第一个与最后一个区间外，所有区间的两端都为常数，它们的积分值自然是常数，对于第一个与最后一个区间，我们用 Newton-Leibniz 公式，由于多项式的原函数仍然是多项式，所以上式右段可以表示成两个多项式和加上若干常数，显然仍是多项式。如果 Max(0,x-Ri)=0，那么变化只是第一个区间变为 0,1，上面的结论仍然成立。由于L-1,L是任取的，所以 )(xfi 在 i=N 时在相邻整数区间可以表示成关于 x 的多项式。根据概率密度函数的定义，有 xx Nx Nx N dttfdttfdttfSP )()()(x

26、)(00其中右端第 1项是常数，第 2项应用 Newton-Leibniz公式仍得到多项式，所以 x)( SP在相邻整数区间可以表示为关于 x 的多项式。至此问题全部解决。我们同样从 N 较小的情况入手，提出了 x)( SP 在相邻整数区间可以用多项式表示的猜想，并加以证明，证明同时也就得到了算法。在方法二中，观察与大胆猜想是解题的核心。 3.1.3 比较两种方法在第一中方法中，我们得到的公式相对简单，方法二中我们为了得到 x)( SP 需要不断积分，相比复杂一些。同时方法一中的证明相对简单，而方法二证明用到了联合概率密度，相对复杂，抽象。但方法二有它的优点：可推广性强。这是因为每

27、个随机变量都是均匀分布这个条件对方法二中的证明来说可以减弱：只要每个随机变量的概率密度函数是多项式就行。而方法一中之所以能把概率看成 N 维体积的比值，其根本原因就是每个随机变量都是均匀分布的。举个简单的例子：如果要求的是 N 个随机数的平方和小于等于 x 的概率，那么方法一将无能为力，而方法二只要简单套用即可。两种方法都从观察简单情况着手，但第二种方法对题目数学本质了解更透彻，这使方法二成为解决连续型随机变量问题的一般性方法。下面我们来看一个复杂的例子。 dttfRixf x RixM a x ii ),0( 1 )(1)(IOI2009 冬令营论文梅诗珂 12 3.2

28、例四： Random Shooting4 题目描述：一个 N 个顶点的凸多边形位于顶点分别为 C（ 0， 0）， D（ 100， 0）， E（ 100， 100）， F（ 0， 100）的正方形中。在正方形中随机选两个点，问它们至少满足下列条件之一的概率是多少？条件 1：两个点中有至少一个点在凸多边形内。条件 2：两个点的连线段与凸多边形相交。约束条件： 3 N 8 , 凸多边形任意 3 顶点不共线，顶点坐标都是 1 到 99 的正整数。分析：我们首先要简化问题。我们设凸多边形的面积为 S ，正方形的面积Total=100*1

29、00=10000。那么两点都在凸多边形内的概率 2)(1 TotalSP 正好有一个点在凸多边形内的概率 )1)(22 To ta lSTo ta lSP 再设 Ni PP 1 i(3 条边相交）第两点连线与凸多边形的，考虑所有与第 i(1 i N)条边相交的两点的集合，它们可以分为两部分：部分 1:其中一点在多边形外，一点在多边形内。由于多边形是凸的，所以这种情况下，连线段只会与之有唯一的交点（不考虑与多边形的顶点相交的情况，下同），因此对不同的边，部分 1 是不相交的。所以所有边的部分 1 的概率和就是 P2。部分 2：两点都在多边形外。由于多边形是凸的，这两点连线一定与其中两条边相

30、交，所以对每个属于部分 2 的两点，正好被计算了 2 次。所以所有边的部分 2 的概率和就是与凸多边形相交）两点都在凸多边形外且2 P( 。于是我们有 P22 P (P3 与凸多边形相交）两点都在凸多边形外且。我们要求的是 2 2321 PPPP 。这样问题就转化为求 P3,也就转化为求两点与每条边相交的概率，大大简化了问题。设当前要计算与边 AB 相交的概率 P，我们让 By Ay(如果 Ay By,则交换 A,B 点 )，这样有向线段 AB 与 x 轴的夹角就在 0, 中。为什么要这样做呢？因为当两点与 AB 相交时，一定一点在 AB 的左侧，另一点在 AB 的右侧，这样我们只要

31、讨论 AB 左侧的点即可。 4 SGU 333 Random Shooting IOI2009 冬令营论文梅诗珂 13 图 1 观察上图，我们发现对固定的点 V(x0,y0),集合 E=(x,y)|U(x,y)与 V的连线与 AB相交就是图中的阴影部分的点。因为我们可以想象 V 是一个点光源， AB 是一块挡板，那么 V 照不到的地方就是 E，也就是 V 向 A， B 分别作射线，其与正方形的交点，与正方形的顶点还有 A， B 围成的区域。我们设 V(x0,y0)点所得到的阴影部分面积为 )0,0( yxSV ，根据连续随机变量概率分布的定义，我们有 d yd xTo ta lyxSP V

32、 1 0 00 1 0 00 ),( (1) 但是 V 可以取无限多个位置，求出每个点 (x,y)的 ),( yxSV 是不可能的，我们需要进一步观察。图 2 我们考虑有向线段 AB中的 A点，从 C,D,E,F分别向 A作射线，与正方形分别交于 G,H,I,J点，这些点将正方形分成了 8 个区域，就得到了图 2。我们很容易就发现相同区域内所有点向 A 作射线与正方形都交于同一边，比如区域 FAC 中的点向 A 作射线都与边 ED 相交，区域GAJ 内点向 A 作射线都与边 FC 相交， HAE 中的点向 A 作射线都与边 CD 相交。我们称 CD 为下边， DE 为右边， EF 为上边

33、， FC 为左边，那么同一区域内的点一定与四条边的唯一一条对应。 IOI2009 冬令营论文梅诗珂 14 图 3 现在回头考虑 AB。观察图 3，我们把 AB 延长，与正方形交于 QR，根据上面的结论，我们只要考虑 QR 左侧 (即四边形 CQRF)即可，从 D,E 分别向 A,B 作射线，他们与正方形的交点把四边形 CQRF 分成了若干区域。相同的区域内点向 A， B 作射线与正方形相交的边是相同的。区域可以按其内的点向 A,B 作射线与正方形相交的边的不同分类。由于区域都在 AB 左侧，那么对任意的点 V， VB 定在 VA 的逆时针方向，所以区域最多只有 10 类： A 左

34、B 左， A 左 B下， A 左 B 右， A 左 B 上， A 下 B 下， A 下 B 右， A 下 B 上， A 右 B 右， A 右 B 上， A 上 B 上。图 4 考虑某一个区域，设其中 VA 与正方形对应边的交点为 Z，当 V 移动到 V 的位置时，设新的交点为 Z 。如图 4 所示，在 A 这一侧产生的面积的差值就是三角形 ZAZ 的面积（可能是负的），对 VB 也有相同的结论。而 VB 在 VA 的逆时针方向，它们不会相交，也就不会互相干扰。这就告诉我们，对同一个区域中的点 V(x,y)，阴影部分面积 ),( yxSV 等于某个常数减去两个三角形的面积。我们称这个常

35、数为基本面积，那么就有 ),(g),(),( yxyxfyxS V 基本面积其中 f(x,y)与 g(x,y)分别表示点 (x,y)在 A 侧与 B 侧的阴影面积与基本面积的出入，它们只与区域有关。我们看图 4 中的左上角的区域，它属于 A 下 B 右区域，基本面积可以看成多边形 ACDEB（一个凹多边形）的面积， IOI2009 冬令营论文梅诗珂 15 )(21)(21),( 2 Ayy AxxAyA x A yAyy AxxAyAxAyyxf ， Bxx ByyBxByBxBxx ByyBxByBxyxg 2)1 0 0()1 0 0)(1 0 0(21)1 0 0()1 0 0)(

36、1 0 0(21),(对每个区域我们可以求出基本面积， f 和 g。而 f,g 其实就是某个三角形的面积，因此每个区域 ),( yxSV 的形式都可以表示为 1120010),( xx yycyy xxccyxS V (2), 其中 c0,c1,c2,x0,y0,x1,y1 都是常数。把 (2)带入（ 1），得 Q Q),( ),(Q),( )1120010(1 区域 yx Qyxyx d y d xxx yycd x d yyy xxcd x d ycT o ta lP (3) 为了计算 Qyxdydxxx yy),( 11 ，我们把每一个区域用竖直线分割成若干小块，每块都是包含两条竖直边的

37、四边形，不妨设这个四边形的四个顶点为（ st， botst），（ st， topst），（ en， boten），（ en， topen），其中 sten,botst topst,boten topen。则对该四边形的边 (st,botst)，（ en,boten），我们可用 y=a1x+r1 表示；对边（ st,topst） ,(en,topen)可用y=a2x+r2 表示，其中 a1,a2,r1,r2 为常数。于是 enst rxa rxaQyx d y d xxx yyd y d xxx yy 22 11),( 1111 enst dxxx cbxax 12 enst dxxx c

38、bxa 1| ) )1ln ( |)1( ln ( |)(2 )( 22 xstxencstenbstena 其中 a,b,c,a ,b ,c都是常数，该区域被分成的四边形的积分值的和就是 Qyx dydxxx yy),( 11 。为了计算 Qyx dxdyyy xx),( )00 只需把区域用水平线分割成若干包含两条水平边的四边形，用相同方法求解。至此本问题已获解决。纵观整个解题过程，正是不断地通过转化，使问题的复杂程度降到可接受的范围，而耐心细致的观察分析则是解决问题的关键，积分技巧的运用并不复杂，也不是难点。这启示我们：解决连续随机变量的概率分布问题，数学功底是基础，观察

39、与分析是关键。 IOI2009 冬令营论文梅诗珂 16 4 总结本文分别对与离散型随机变量和连续型随机变量有关的问题举了两个例子。第一个例子中，我们灵活应用组合数的性质解决了最大胜率问题；第二个例子中，我们通过定义随机数生成器的层数与误差分析，得到了最优的随机触发装置；第三个例子中，分别应用补集转化和函数分段求解两种方法分别，解决了多个随机变量和的分布问题，并进行了比较；第四个例子中，我们通过对凸多边形的简化和分情况讨论，最终把问题归结为求解一个积分式。四道题的解法各有特色，这正是概率问题复杂多变的表现。但从分析过程中

40、也不难总结出一些通用的原则。四道题无一例外地要求对数学定义与相关知识准确地把握；从简单情况进行分析着手，强调简化问题。这些原则都是由概率问题数学性强、抽象复杂的特点决定的。化繁为简、化抽象为形象，是分析求解概率问题的重要思路。感谢感谢刘汝佳老师在论文选题上的指导！感谢寿鹤鸣同学对论文修改提出的宝贵意见！感谢集训队的金斌同学对解题提供的帮助！感谢集训队的汤可因同学的帮助！感谢唐文斌、胡伟栋教练的指导！参考文献 1算法导论美 Thomas H.Cormen 等著 2概率论何书元著 3算法艺术与信息学竞赛刘汝佳、黄亮著 4.数学分析教程常庚哲、史济怀

41、著 5国家集训队 2005 至 2008 年论文附录附录 1 V(0,R1,0,R2, ,0,RN,x)的表示。 V(0,R1,0,R2, 0,RN,x) =V(0,+ )-(R1,+ ),0,+ )-(R2,+ ), , 0,+ )-(R2,+ ),x) IOI2009 冬令营论文梅诗珂 17 设 ,0 ii RD (1 i N)，设集合 ,.,2,1 NQ 为所有满足 ii RD 下标集合，那么 V(0,R1,0,R2,0,RN,x)= Ni NiQi xDDDV0 ,21| ),) ,. . . (,(),()1(该式与容斥原理的公式相近。附录 2 对 V(0,+ ), 0,

42、+ ), , 0,+ ),x)的值为 !NxN 的证明。证明：用归纳法，当 N=1 时， V(0,+ ),x) = x 显然符合结论。设当 N=2,3, ,k-1 时都有结论成立，那么 N=k 时， V(0,+ ), 0,+ ), , 0,+ ),x)就是一个 k 维锥体的 k 维体积，椎体的底面面积是)!1(1kxk 。同时我们知道体积就是截面面积的积分值，而对与锥体的顶点距离为 h 的截面而言，其截面面积为 11 )()!1( kkxhkx,所以 V(0,+ ), 0,+ ), , 0,+ ),x) = !)0()!1( 1)()!1(0 11kxkxkdhxhkxkkx kk

43、附录 3 论文原题 LastMarble 题目描述： Problem Statement A bag is filled with a given quantity of red and blue marbles. In each turn, a player reaches into the bag and removes 1, 2, or 3 marbles. The player looks to see the color of the marbles, and announces how many of each color marble were removed. The last

44、 player to remove a red marble from the bag loses. You are given ints red and blue, the number of red and blue marbles initially in the bag. Before play begins, a friend removes several of the marbles from the bag, at random, without showing either of you, given in int removed. Assuming you go first

45、, and each player makes the optimal choice of number of marbles to remove, calculate the probability that you win the game. IOI2009 冬令营论文梅诗珂 18 Definition Class: LastMarble Method: winningChance Parameters: int, int, int Returns: double Method signature: double winningChance(int red, int blue, int

46、removed) (be sure your method is public) Notes -Return value must be within 1e-9 absolute or relative error of the actual result. Constraints -red will be between 1 and 100, inclusive.-blue will be between 1 and 100, inclusive.-removed will be between 0 and red - 1, inclusive. Randomness 题目描述： Probl

47、em C Randomness Input: Standard Input Output: Standard Output Efficient generation of “true“ random numbers is an interesting problem in Computer Science. The reasonably fast random number generators (RNGs) that are provided in code libraries are usually merely “pseudorandom“. They have a finite cycle length and their low-order bits can be predictable to some extent. Even if the RNGs themselves could be perfect, their common u

展开阅读全文