1、浅谈补集转化思想在统计问题中的应用目录前言2关键字2摘要2正文2例一3题目大意3初步分析3深入思考3补集转化4小结5例二6题目大意6初步分析6几个工具7补集转化7小结8总结9前言不管是在实际生活中还是在信息学竞赛里,都常常会遇到统计问题,即对满足某些性质的对象进行计数的问题。解决统计问题有一些常用的方法比如离散化、极大化、二分、事件表等等,利用它们基本上可以解决大多数的统计问题。我们不妨将这些方法称为解决统计问题的常规方法。然而世上的任何事物都是既有普遍性,又有特殊性的。确实存在一部分统计问题,用常规方法是很难甚至是根本无法解决的。对于这些问题,就应该具体情况具体分析,采用非常规的解法。本文中
2、将要讨论的就是这些非常规解法中的一种利用补集转化思想解决统计问题。关键字统计问题 常规非常规(统计)方法 枚举 时间思维编程复杂度补集转化 组合计数 有序化 枚举对象 枚举量摘要本文通过对两个例题单色三角形问题(POI9714)和海战游戏(改编自 Ural1212) ,探讨了补集转化思想在统计问题中的应用,分析比较了补集转化思想在两个例子中的作用效果和价值。最后得出结论:补集转化思想应用于统计问题中往往有着很好的效果,我们应该注意培养逆向思维,掌握好这种非常规的统计方法。正文统计问题,我们认为是对于满足某些性质的对象进行计数的问题。既然是计数,那么不可避免地,其解法或多或少地建立于枚举之上。在
3、很多情况下,“枚举”往往是低效的代名词。因此,我们通常所见到的统计问题,其最好解法动辄就达到 O(n2)、O(n 3)的时间复杂度,也因此统计问题的规模往往不是很大,一般都在 1000 以内。如果光是这样也就罢了,更糟糕的是很多统计问题,按照直观的想法设计出来的算法往往具有令人望而生畏的时间复杂度:要么 n 的指数过高,要么题目中给的 n 就是很大的,或者时间复杂度是关于另外一个很大的量 M(往往是表格的尺寸、图的边数等等)的表达式总之,这个时候的统计问题实在不那么讨人喜欢。于是我们又需要利用很多技巧来降低复杂度,离散化和极大化思想、二分法、事件表等技术都是非常有用的,在它们的帮助下,我们成功
4、地解决了非常多的刁钻的统计问题,以至于这些技巧也已经成了理所当然的“常规”方法,很多本来棘手的统计问题也成了常规题。然而这些方法显然也有不那么奏效的时候,这时我们就需要一些非常规的方法来解决一些更加棘手的问题。这些非常规方法之一就是利用补集转化思想来帮助解决统计问题。补集转化思想在很多方面有着广泛的应用,让我们来看看在解决统计问题方面它又有哪些精彩表现吧!例一 单色三角形问题(POI9714 TRO)题目大意空间里有 n 个点,任意三点不共线。每两点之间都用红色或黑色线段(只有一条,非红即黑!)连接。如果一个三角形的三条边同色,则称这个三角形是单色三角形。对于给定的红色线段的列表,找出单色三角
5、形的个数。例如图一中有 5 个点,10 条边,形成 3 个单色三角形。输入点数 n、红色边数 m 以及这 m 条红色的边所连接的顶点标号,输出单色三角形个数 R。3=P 且 Y=Q,所以如果 X=AX1-1) and (BY1=AY1-1)。 设一个已经摆放的矩形 A 为 X 行 Y 列,新摆放的矩形 B 为 P 行 Q 列,矩形 B 怎样摆放才能和矩形 A 相交呢?根据结论二我们直接就可以得出结论三:矩形 B 能够与 A 相交的所有方案位于一个 2P+X 行,2Q+Y 列的矩形框内。如图六,正中的黑色矩形是矩形 A,四角的绿色矩形代表矩形 B能够和 A 相交的摆放方式的“边界情况” 。当然,
6、这样说还不是太严密,因为这个矩形框有可能超出了棋盘的边界,此时它的边就要调整到棋盘边界内。所以我们把结论三改为:矩形 B 能够与 A 相交的所有方案位于一个 最多2P+X 行, 最多 2Q+Y 列的矩形框内。图六补集转化根据结论一,在给定的棋盘上不加限制摆放一个矩形,其方案数 S 是可以根据公式计算出来的。而符合规则的摆放方案数 R违反规则的摆放方案数TS,因此 R=S-T。问题就转化为:如何高效地求出 T。T 也就是所有与已经摆放的军舰相交的方案数。在结论三的基础上稍加判断,再结合结论一,我们实际上已经能够直接计算和任意一个已经摆放的矩形相交的方案数。但是我们并不能把和每一个已有矩形相交的方
7、案数累加起来作为 T。因为有些摆放方案会同时和不止一个矩形相交,例如图七中,蓝色的矩形同时和两个黑色黑色已摆放矩形相交。但是按照上面的算法,这种蓝色的摆放方案会被重复计入 T,导致 T 比实际的要大。图七如何排除这种重复计数呢?我们采用一种排除重复的常用方法:有序化。也就是设法对于新矩形的一种摆放方案,只在处理与它相交的编号最小的已有矩形时才允许计入总数 T。例如图七中,如果我们规定左边的黑色矩形编号较小,则在处理右边的黑色矩形时,与它相交的蓝色摆放方案就不允许计入 T,因为右边的黑色矩形并不是与蓝色方案相交的编号最小的已摆放矩形。容易证明,这样计数不会出现重复。为了做到这一点,我们只需采取如
8、下算法:依次处理每个已经摆放的矩形,设当前处理的矩形编号为 i,一一枚举与它相交的摆放方案,对于每个方案,再依次枚举编号为 1,2,(i-1)的矩形,判断这些矩形能否与当前枚举的方案相交,如果发现有相交的情况,则此方案不能计入 T,否则就将 T 加 1。根据结论三,与每个已摆放的 X 行 Y 列的矩形相交的摆放方案位于它周围的一个矩形框内,这个矩形框最多 2P+X 行,2Q+Y 列,再根据结论一,在其中摆放 P 行 Q 列的矩形最多只有(P+X+1)*(Q+Y+1) 种方案,由于每个矩形的大小均在 P*Q 这样的级别,所以总共需要处理的方案数规模为 O(P2Q2L),而对于每个方案,最多只需要
9、枚举 L1 个已摆放矩形判断是否与之相交,根据结论二,判断两个矩形是否相交的复杂度为 O(1),所以处理每个方案的复杂度为 O(L),因此整个算法的复杂度仅为 O(P2Q2*L2),非常优秀,大大领先于离散化的常规方法。而且,一旦想到了补集转化,则下面的分析、算法设计都非常自然,程序基本上都是循环枚举和简单的判断。可以说,在思维复杂度和编程复杂度上,基于补集转化的算法比离散化的常规算法好得多。小结在这个例子中,离散化思想能够帮助我们解决原题,但是时间、思维和编程复杂度都很高。但是利用补集转化思想,我们却可以设计出全面超越离散化算法的新算法。本题从正面考虑,枚举量太大,所以常规的解法是采用离散化
10、技巧来减少枚举量。但是从反面考虑,枚举量就非常小了。补集转化思想在这里起到的作用是帮助我们选择了合适的枚举对象,从而减少了枚举量。总结本文中的两个例子都是利用补集转化思想解决统计问题,它们在思想上有着明显的相同点:如果目标 R 比较难以求解,而它的补集 T 以及 R 和 T 的总和S 相对容易求出,那么不妨从反面考虑,求出 S 和 T,也就间接地求出了 R。但是补集转化思想体现在两个具体的例子中,又有所不同:从作用效果上来看,在例 1 中,补集转化思想指导我们设计出了本质上不同于单纯枚举的算法枚举组合计数,可以说是“另辟奚径” ;而在例 2 中,它并没有改变算法的本质,而只是通过改变枚举对象减
11、少了枚举量。由此可见,补集转化思想应用于统计问题的形式是多种多样的,可以从解决问题的每个方面帮助我们。从意义价值上看,在例 1 中,补集转化思想似乎是解决问题的唯一可行方法;而在例 2 中,用离散化也可以解决问题,但补集转化的算法更自然、更优秀,更有普遍性。由此可见,补集转化思想不仅可以应用于一些非常规的统计问题,而且对于一些常规算法能够解决的问题,应用补集转化思想也许可以做得更好。总之,补集转化思想可以比较广泛地应用于统计问题中,是解决统计问题的一种很值得掌握的非常规思想。补集转化思想,体现了矛盾对立统一,互相转化的一种哲学观念。统计问题的本质就是在给定了对象之间的一系列关联、限制(也就是矛盾)的基础上进行计数的问题。所以在统计问题中灵活地应用补集转化思想,往往可以起到“出奇制胜”的效果。我们应该注意培养逆向思维的能力,才能用好、用活补集转化思想。值得注意的是,利用补集转化思想解决统计问题作为一种非常规的统计方法,它和一些常规的统计方法、技巧之间的关系是辨证的。虽然在本文的例子中,补集转化思想有着很多的闪光之处,但是并不能认为常规方法一定不如非常规方法。大多数的统计问题还是适合用常规方法的,所以只有将常规方法和非常规方法都灵活地掌握,并对于具体问题选择合适的方法,才能够游刃有余地解决统计问题。