1、天平秤球中的信息论天平秤球过程是人们对事物认识不断深化的过程。从一开始的一无所知,通过分盘秤球,逐步加深认识,直到最后完全了解为止。因此,用信息论方法来描述这一过程会获得意想不到的结果。(虽然本文撰写并不要求读者掌握信息论,但先学点信息论基础对本文的阅读与理解有帮助。)m 个球中含有一个次球,通过 n 次天平秤球,查寻次球并确定其轻重。球编号为 1, ,m。初始,球的状态用原始向量X=(x1,xm)来表示,x i 为 0 表示 i 号球为正品,1 重球,-1轻球;仅有一个 xi 为 1 或-1。分盘秤球过程中,人们对球的估计与判定用估判向量 Y=(y1,ym) 来表示,y i 为 0 表示判定
2、 i 号球为正品,1 疑重球(或重球或正品),-1 疑轻球(或轻球或正品),2待定球(或重球或轻球或正品)。统计估判向量 Y 中的疑重球数 z,疑轻球数,待定球数 d,正品好球数 h,z+q+d+h=m。秤球过程中,估判向量 Y 不断变化。从初始的 Y=(2,2),z=q=0,d=m 开始,每次秤球后,Y 都有所变化,直到 Y 仅含有一个分量 yi 为 1(或-1)为止。此时 Y=X,z+q=1,d=0。为方便讨论,第i 次秤球后估判向量 Y 记为 Y(i);为简化书写长度,估判向量Y=(y11,ym)有时写成 Y=(z,q,d)。一、估判向量的信息量下面考察秤球过程中估判向量 Y 信息量(即
3、其不肯性)的变化:1, 初始,估判向量 Y(0)=(2,2),次球可能在 1,m 号位置上,其取值有 2 中可能 :1 或-1。因此,有 2m 种可能状态,初始Y(0)的信息量 I(0)为 log(2m),(底为 2,下同)。2, 第 i 次秤球后,估判向量 Y(i)的各分量有多种可能。但仅有两种类型:一种是 z=0,q=0,d0,此时,Y (i)的各分量仅为 0 与2,Y (i)的信息量为 log(2d);另一种是 z+q0,d=0,此时,Y (i)的各分量仅为 0,1 与-1 ,Y (i)的信息量 I(i)为 log(z+q);3, 最后,估判向量 Y(n)的各分量仅有一个为 1 或-1,
4、即z=1,q=0 或者 z=0,q=1。z+q=1, Y(n)的信息量 I(n)为 log(z+q)=log(1)=0。此表明,不肯定性完全消失,查寻完成。综上所述,对于所有的第 i 次秤球后,估判向量 Y(i)的信息量 I(i)=log(z+q+2d)。例 1。设 m=10,X=(0,0,1,0),即第 9 号球为重球。初始,Y (0)=(2,2), 其信息量 I(0)=log(2*10)=log(20)。第一次秤球时,左盘 1-3 号球,右盘 4-6 球,不放盘 7-10 号球。秤球结果:平衡。估判向量 Y 变为 Y(1)=(0,0,0,0,0,0,2,2,2,2);z=0,q=0,d=4
5、;其信息量 I(1)=log(2*4)=log(8)。例 2,m=14,X=(1,0,0),即第 1 号球为重球。第一次秤球时,左盘 1-5 号球,右盘 5-10 球,不放盘 11-14 号球。秤球结果:左重右轻。估判向量 Y 变为 Y(1)=(1,1,1,1,1,-1 ,-1,-1,-1,-1,0,0,0,0);z=5,q=5,d=0;其信息量 I(1)=log(5+5)=log(10)。二、秤球的互信息对于第 i 次秤球一次而言,估判向量 Y 从原先的 Y(i-1) 变成 Y(i)。其信息量从 I(i-1)变成 I(i),信息量减少了。所减少的信息量 I(i-1)-I(i)是第i 次秤球所
6、提供的信息量,称为秤球的互信息,记为 H(i):H(i)=I(i-1)-I(i)H(i)表示第 i 次秤球所生成的不肯定性下降量。如在例 1 中, H(1)= I(0)-I(1)=log(20)-log(8)=log(2.5)=1.3219。在例 2中,H(1)= I(0)-I(1)=log(20)-log(10)=log(2)=1。秤球的过程是不肯定性不断减少的过程,也即估判向量 Y 的信息量不断减少的过程。通过秤球所提供的互信息,使得原先的不肯定性下降到 0 为止。于是,通过 n 次秤球可判定次球及其轻重,其初始的不肯定性 I(0)可分解为I(0)= H(1)+ H(2)+ H(n)事实上
7、,I (0)=( I(0)-I(1)+ ( I(1)-I(2)+( I(n-1)-I(n)+ I(n),而 I(n) =0。三、 用信息论探讨秤球的分盘方法下面对天平秤球作遍历性讨论。n 次秤球的遍历实际是一个三叉树。对于第 i 次天平秤球,有三种结果:平衡,左重右轻,左轻右重。其生成的互信息记为 H0(i), H1(i), H-1(i)。因此,其加权平均为H(i)=p0*H0(i)+p1*H1(i)+p-1*H-1(i)其中,p 0 ,p1 ,p-1 分别表示在平衡,左重右轻,左轻右重时形成估判向量中所包含的球状态数的百分比。(参见下例 m=13 的第一次分盘秤球)。1, 均匀分盘及其秤球所
8、生成的互信息对于第 i 次分盘而言,其原先的估判向量 Y(i-1) 。当z=0,q=0,d0,d 是 3 的倍数,或者 d=0,z+q1,z 与 q 都是 3 的倍数时,可进行均匀分盘,即放在左盘、右盘及不放盘的球数相等。如 d=da+db+dc0,da=db=dc=d/3,分别表示放在左盘、右盘及不放盘的球数。此时,原先估判向量 Y(i-1)的信息量 I(i-1)=log(2d),而秤球时,如天平平衡,估判向量 Y(i)的信息量 I(i)=log(2d/3),本次秤球所生成的互信息 H0(i)= I(0)-I(1)= log(2d)-log(2d/3)=log(3);如天平左重右轻,估判向量
9、 Y(i)的信息量 I(i)=log(da+db)=log(2d/3),本次秤球所生成的互信息 H1(i)= I(0)-I(1)= log(2d)-log(2d/3)=log(3);如天平左轻右重,同样的所生成的互信息 H-1(i)=log(3)。故,其平均,H(i)=log(3)。如 d=0,z=za+zb+zc=z/30,q=qa+qb+qc=q/3 ,并分别表示放在左盘、右盘及不放盘的球数。此时,原先估判向量 Y(i-1)的信息量I(i-1)=log(z+q),而秤球时,如天平平衡,估判向量 Y(i)的信息量 I(i)=log(zc+qc), 所生成的互信息 H0(i)= I(0)-I(
10、1)=log(3); 同理,H 1(i)= H-1(i)= log(3)。故,其平均,H(i)=log(3) 。结论:均匀分盘秤球所生成的互信息 H(i)=log(3)。根据最大熵原理,均匀分盘秤球的互信息 H(i)的互信息 H(i)最大,其他不等量分盘一次秤球所生成的互信息均log(2 m);(3n)2m),即(3n)/2m ;考虑到整除,应(3n-1)/2m也即 (3n-3)/2=m, 于是有 M(n)=(3n-3)/2。如 M(3)=12;M(4)=39。 M(n+1)=3*(M(n)+1)=3n+M(n)公式(1)仅给出最大球数 M(n)的算式,没有提供具体的秤法。反函数运算则得公式(2)。参考文献:1 mjwu “天平秤球的最佳规格化算法”, 百度文库 2013.42 mjwu “天平秤球智力游戏”软件,待发布