1、基于信息维数的复杂网络自相似性的研究,引言 BA模型的扩展 复杂网络的自相似性研究 仿真分析 结论 参考文献,1.引言,1960年数学家Erdos和Renyi提出了随机图理论,研究复杂网络中随机的拓扑模型,自此ER模型一直是研究复杂网络的基本模型。但是,但是近年的研究发现:现实网络中得到的许多实验数据结果与随机图模型并不符合,因此需要新的网络模型合理描述实际网络。1998年Watts和Strgatz提出了小世界(WS)模型2,刻画了真实的网络所兼有的大聚簇和短平均路径距离的特性。然而现实世界中的网络还被统计到极少数接点拥有大量的连接,而众多的接点仅具有少量连接的特性,这些也无法用随机图模型加以
2、合理解释。,999年Barabasi和Albert提出了无尺度模型(BA)3。BA模型指出了决定互联网、万维网等网络具有无尺度模型的两个基本原理:增长性和择优连接。虽然小世界网络与无尺度网络刻画了网络的基本特性,但它们是基于对现实网络进行简化的前提下得到的结果。因此我们有必要对复杂网络建模进行深入研究,使它更加符合现实世界。本文提出了网络的自相似性,网络通过节点与节点相连汇聚形成,节点与节点之间是通过某种共性而连接在一起的。如人际关系之间的“物以类聚,人以群分”。 。,2 .BA模型的扩展,BA模型在研究在引起了很多人的注意。除了对模型本身进行定性或定量研究外,很多人建议应扩展或修正该模型,使
3、其行为更接近实际网络。BA模型认为顶点的年龄和度数之间有相关性,而Adamic 和Huberman发现实际的WWW网中没有这一性质。因为他们认为,顶点的度是其内在价值的函数,有些Web站点对相对较多的人有用,因而就有更高的连接率。,Bianconi和Barabasi通过模仿这一过程提出了BA模型的一个扩展模型。在他们的扩展模型中,每个新出现的顶点i都赋予一个“适应度”fi,它代表该顶点的吸引力和由些而产生新连接的倾向。适应度是从某一分布中选取的。新边连接到顶点i的概率不是与顶点的度数ki成比例,而是与kifi 成比例。模型算法如下:,(1)开始总共有N个节点,每一个节点i分配一个度fi,fi是
4、一个真实的数值为了测量它的重要性或级别。度值是一个从给定的概率p(x)中随机获得的数字。 对每一对节点,i,j 相连接的概率是f(xi,xj), f(xi,xj)依赖于在xi,xj上两个顶点的重要性。,“度的重要性 ”或适应度在复杂网络领域中已经成功的介绍过了,但在BA模型中是作为一种附加的成份。当然,在这里通过消除择优规则而强调适应度的重要性。正如所定义的,模型是静态的,但通过在每一时间步里加入新的节点可以把它看作动态的,通过上述规则把它们连接到已存在的节点上。,对BA模型的另一推广就是顶点拷贝模型。Kleinberg等人认为有些模型是通过拷贝顶点来生长的。他们对Web网的生长感兴趣,其模型
5、介绍如下。该网络通过随机地增加顶点、随机地增加边或从其他顶点拷贝边来进行生长。特别地,我们先选择一个已经存在的顶点及M条边,然后确定这M条边的目标顶点,通过随机地选择其他顶点或拷贝这M条边的目标顶点,即可完成一个网络图的生长。,如果所选顶点出席小于M,则其M条边将是拷贝的,且一个顶点接一个顶点地拷贝它的边,直到M条边都拷贝完为止。显然,拷贝机制将会产生幂律度分布。随机选取某个顶点,它的一条边连向入度为K的其他某个特定顶点的概率是与K与比例的。因而,一个顶点的度数的增加与其当前度数成比例。但这会出现一种特殊情况,即当前度数为0的顶点将永远不会获取新的边。,3. 自相似性复杂网络,3.1问题的提出
6、 虽然BA扩展模型描述现实世界中网络最基本的特性,但它们仍然存在一定的局限性。在现实世界中一些网络常常并不具有幂律特征,如指数中止、小变量饱和等。为了在微观层面更深入研究复杂网络的拓扑结构和演化规律,研究人员作了大量新的尝试和努力,对网络的演化与建模已经有了长足的进展,演化因素包括各种类型的择优连接、局域世界、竞争等。,尽管众多的网络演化模型已经被用来分析和研究可能潜藏的演化规律,但这些研究仍然忽视了一些重要因素。例如计算机网络节点之间的连接。如果是按照择优连接概率:则新的节点会全部连接到同一个节点上,但现实网络并非如此,而是形成不同的集散节点。这个例子说明了网络节点之间的连接有可能是基于一些
7、相似的性质,节点与节点之间有某种共性才相连。因此建立并研究基于相似性的网络演化模型有利于我们更好地认识现实世界中的复杂网络 。,3.2 自相似性网络容量维数,1975 年美国数学系教授曼德布罗特首次提出了“分形”概念,其原意是“不规则的、非整数的、支离破碎的”物体,我们把具有某种自相似性的图形或集合称为分形。 大自然中存在的不规则的物体,可能存在不同尺度上的相似性,称为自相似性。,自相似性就是局部与整体相似,局部中又有相似的局部,每一小局部中包含的细节并不比整体所包含的少,不断重复的无穷嵌套,形成了奇妙的分形图案,它不但包括严格的几何相似性,而且包括通过大量的统计而呈现出的自相似性。 自然界存
8、在大量统计意义下的自相似体,一般并不知道自相似比。,为了解决这类物体的维数计算,发展了计算容量相似维数方法。常用的容量维数分析方法有变方法、结构函数法,自仿射法以及盒子覆盖算法。其中盒子覆盖算法简单、快速、精确得到广泛应用。本文采用盒子覆盖算法来计算网络容量维数。计算相似比时,采用圆片(或方块)去填充(或覆盖)被测对象,统计覆盖所需的方块数来计算其维数。如此方法计算的维数称为容量维数。,如果用长度为 尺子去测长度为 的线段,与 之比为 。 值的大小与 长短有关,越小 越大:。 对于 维物体:取对数得容量相似维数:,3.3 自相似性网络信息维数,分维是分形几何学中的一个十分重要的参数,利用分维测
9、量图形的自相似性计算方法很多9。在复杂网络的自相似性研究中,常常应用的是容量维(计盒维)。容量维的计算仅考虑了覆盖整个网络的盒子数,而未考虑一个盒子内所包含的节点数。显然,应用容量维数描述复杂网络的自相似性特征有其局限性10。,鉴于此,本文应用信息维数法研究复杂网络的自相似性并探讨复杂网络与自相似性之间的关系。 通常网络中节点的分布具有不均匀性,导致不同计数盒子覆盖不同的节点数。为了能够客观的反映每个盒子中覆盖的节点数对容量维数进行如下改进:,(1) 对每个覆盖盒子按填充程度(所含点多少)进行编号;(2) 统计出分形结构落入第 i 只盒子的几率 Pi(r):,(1),由公式(1)可得出信息公式
10、:,由公式(1)与公式(2)得出信息维数公式,(2),(3),3.4 自相似特性测量方法现实中的网络是动态增长的,为了测量复杂网络的自相似性,以网络的增长为例来测量不同阶段网络的自相似维数。不同阶段的网络为:起初形成的小局部网络,增长稍大些的网络,再到最终形成的网络。测量它们的自相似性维数的具体方法是:,1 在被测网络上覆盖边长为 r 的小正方形,统计一下有多少个正方形中含有被测对象,为每一个正方形编号,统计出节点落入盒子中的概率,记入 P(r)中。 2 缩小正方形边长,再统计一下有多少个正方形中含有被测对象,再统计出节点落入盒子中的概率,记入P(r)中,以此类推。 3 统计不同的r值下记入的
11、P(r)值。,(4) 根据不同的p(r)值,计算不同的I(r)值,最后得出信息维数Di分别计算出处于不同阶段网络的自相似容量维数 D1 、D2 、D3 与D4 。如果这几个维数取相同或相近值(容量维数具有最小标度与最大标度),则表明网络具有自相似性。,3.5 仿真分析与比较,有待,4 结论,本文在详细阐述复杂网络的小世界模型与无尺度模型的演化过程之后,提出了复杂网络的自相似性质,引进了分形数学思想,给出了具体的计算相似容量维数方法,并用此方法分析了复杂网络在不同阶段的容量维数,得出维数相同(或相近)具有自相似的特性,又给出了仿真分析结果。,为了更深入地了解各种复杂网络(从生物基因进化网络到像语
12、言学、世界贸易网、社会经济网络等等)中的微观演化过程, 用盒子覆盖方法测量复杂网络的自相似性是一种强有力的工具,本文所提出的复杂网络的自相似性还有待更进一步的研究。,Albert R. & Barabasi, A.-L. Statistical mechanics of complex networks. Rev. Mod. Phys 74,47-97(2002) Pastor-Satorras, R. & Vespignani, A. Evolution and Structure of the Internet: a Statistical Physics Approach (Cambri
13、dge University Press, Cambridge, 2004).,参考文献,Newman, M. E. J. The structure and function of complex networks. SIAM Review 45, 167-256(2003). Chaoming Song, Shlomo Havlin, Hernan A. Makse1.letters to nature,2005. R. Guimera, L. Danon, A. Daz-Guilera,Self-similar community structure in a network of human interactions, PHYSICAL REVIEW E 68, 065103R! 2003!,谢谢,