1、第6章 通信网的可靠性,概述,整个网络的可靠性依赖于每个子系统的可靠性;即使每个子系统的可靠度很大,如果构成网络的方式不好,整体的可靠度就不会达到指标。选择合理的拓扑结构和增加冗余投资来弥补故障的影响。,6.1 可靠性理论概要,要研究可靠性,首先要明确提出“可靠”或“不可靠”得定义。显然,常出故障必然不可靠,那么就应明确故障的含义。由于故障具有随机的性质,同一产品不一定同时损坏。随机性的描述,只能用概率的方法,因而可靠性也只能在概率意义上来定义。有时一个设备中某一部件性能下降,但并不损坏,已使设备不能正常运行;而在另一个设备中,这种性能下降,并不影响设备的运行或影响不大。这就使我们想到设备的运
2、行状态来规定可靠性。对于简单系统,假设它仅包含两个状态:正常和故障。,6.1.1 不可修复系统,研究可靠性的对象大致可分为两类:一为不可修复系统;另一为可修复系统。所谓不可修复系统就是该系统一旦启用,直到损坏或失效为止。这种系统只有两种状态:运行和失效;而且只有运行状态向失效状态转移一种可能。一旦失效,就不会再回到运行状态。一般用可靠度 来衡量不可修复系统的可靠性。令 等于系统运行了时间t时仍在正常工作的概率,则可定义系统在t时的可靠度为 。显然, ,即起始运行时应为正常的,或立即失效的概率接近零。由于概率的归一性, 是t时系统失效的概率,有时称之为系统在t时的不可靠度。可靠度和不可靠度都可用
3、来描述系统的可靠性。,要计算可靠度 ,可引入失效率 。这被定义为当t时系统正常运行的条件下,在t到 内失效的条件概率为 。一般而论, 是t 的函数。这样可用条件概率的公式得到即t时在正常运行,到 时还在正常运行的概率必须在 内不出故障,后者的概率是 。令 ,上式成为 这是可靠性的微分方程。在 的起始条件下,可解得若 是与t无关的常量,即得,若 已知,就可利用上面的几个式子计算可靠度 。这是以t为参量,运行状态作为二元随机变量而求得的状态概率。另一方面,也可把t作为因变量,来定义系统的寿命,即当系统在t时失效,就认为该系统的寿命是t,t是连续随机变量。t时刻尚在运行的概率 就是寿命大于t的概率,
4、即 因此,寿命t的概率密度函数f(t)为 而系统的平均寿命为 当 是与t无关的常熟时,即寿命分布为参数 的负指数分布,此时系统的平均寿命为平均寿命T是表征系统可靠性的重要参量。定性的说,T愈大。系统愈可靠。由上式可以知道,T与 一样,都可以用来充分描述系统的可靠性,也就是系统的可靠性。系统在平均寿命到达时尚能运行的概率为e-1=0.368,说明有些系统可能在平均寿命到前失效。即寿命短于平均寿命。要确定系统的可靠性和失效率,可用实际测量来估计。设有N0系统同时开动,随着时间的推移,有些系统必将失效。到t时若尚余N(t)个系统在运行,则 可作为 的估值 。若N0足够大,这估值将接近实际的 。,为了
5、方便计算,常用公式来表示图6.1(b)所示曲线,作为 的近似,即用如下威布尔函数分布,A可用 在t1处的连续性求得,即,6.1.2可修复系统,如果一个子系统在故障后,经历一段时间,修复又重新使用,如此循环往复,这种系统称之为可修复系统。可修复系统状态规定两个,即正常运行和出故障或失败,不但可以从正常运行状态转移到失效状态,而且还能从失效状态转移到正常运行状态。同时增加了一个特征参数: 修复率 。,在时刻t系统处于故障的条件下, 在(t, t+t)内修复的概率为: 。设,为常量,与时间无关。若 是在 时系统正常运行的概率,有两种情况可到达运行状态:即t时在运行,t到 之间不出故障;以及t时已失效
6、,t到 之间能修复。于是取极限当 和 为常量时,,当t时,此时R(t)有极限值, 这个值表示了稳态可靠度。,定义T1- 平均故障间隔时间(MTBF)T2- 平均修复时间(MTTR)R称运行率,要确定和 或 MTBF 和MTTR,故障间隔时间是随机的,其样值分别为T11, T12, 修复时间也是随机的,其样值分别是T21, T22, 当试验时间足够长,或周期N足够大时,可得MTBF 和MTTR的估值如下,从上述公式可以看出,要增大系统的可靠性,降低 或增加MTBF当然很重要,这就是设备出厂时的重要指标。但是,降低平均修复时间或者增加 也会起重要作用。可修复系统和不可修复系统的区分并不是绝对的,在
7、一定条件下它们可以相互转换。,4.1.3 复杂系统分解,(1)串接系统 若干子系统,只要一个坏,全系统不能工作。当各个子系统独立时, 总可靠度: 不可靠度为,已知各子系统的可靠度Rr总是小于1的,那么串接系统的可靠度必小于任一子系统的可靠度,而且串接系统愈多,可靠度也将越小。当各不可修复的子系统有不同失效率 时,同样可得全系统的可靠度为而平均寿命和等效失效率分别为,当各子系统都是可修复系统时,在全系统运行中,只要有一个子系统出故障,就使全系统失效。若每个子系统的失效率为 ,则由于独立性,总失效率将为 这与不可修复系统没有区别,所以,全系统的平均故障间隔时间将为,如果系统不独立, 某一个系统损坏
8、后, 其余系统停止工作以减少损耗.第r个子系统失效的概率与 成正比,平均修复时间为 。全系统的平均修复时间为:平均故障时间为于是,全系统的可靠度就是,与各子系统独立时的可靠度相比,由于就有,(2)并接系统 若干系统组网,只要一个好,即为正常工作;都坏,才不能正常工作。各子系统独立时, ,其中不可靠度 。同样, 先考虑独立的情形, 再考虑非独立的情形; 并且分为不可修复和可修复系统两类情形.,(1)当各子系统均为不可修复时若各子系统都是不可修复时,全系统的可靠度为则平均寿命为,所以 , 说明并接系统虽然寿命在 时趋向于 , 但效率很低。此时,可采用折中方式,即半热备份的方式。一个子系统在运行,另
9、一个处于半工作状态,如预热而未加高压。这样一来,置换所需要的中断时间可减少至可以容忍,由于处于半热状态下,故障率一般比正常工作时要低,则可延长寿命。,例子:两个子系统并接运行, 子系统1运行的失效率为 ; 子系统2半热备份, 半热备份时的失效率为 , 它工作时的失效率为 。,冷备份(旁置),(2)当各子系统均为可修复时 当整个系统失效时, 平均修复时间为 又 于是,例子:修复力量有限, 规定当2个子系统都出故障时, 先修第一个子系统.,状态转移图如上图, 状态方程为:同时有归一性, 解得:,可靠度为: 如果修复力量无限制, 为简单并接系统,可靠度为 而 显然有(3) 混接系统,上图中上面一个分
10、支是串接,那么它的可靠性为 ,不可靠度为 ,再与下面的分支并接,则不可靠度将为或全系统的可靠度为对于图6.6,,对于右图,6.1.4 综合可靠度,前面几节讨论的可靠度均认为是系统只有两种状态:正常运行或是失效。可靠度就是正常运行的概率。但是在实际问题中,往往还有中间状态。例如,系统尚能运行,但性能已下降到不可容忍的状态。从概率论意义上说,可靠性是一种概率。前几节所讨论的是状态变量为二元的情况,也就是最简单的情况,当考虑到运行性能或其他要求时,可能有几个参量必须考虑,或者说有几个随机变量。有些是离散随机变量,有些可能是连续变量,即使是离散变量,也不一定是二元的,可能是多元的。对于这样的问题,可根
11、据这些变量来定义综合可靠度。,6.1.4 综合可靠度,设有n个参量 影响系统的可靠性,这些参量一般为随机变量, 其概率密度函数为: ,若有些变量是离散的, 中将含有 函数。这些变量的取值范围分别为根据可靠性的要求来定义可靠集 和不可靠集 ,即,6.1.4 综合可靠度,变量取值范围集 ,即则有可靠度为不可靠度为,6.1.4 综合可靠度,显然这样的可靠度也可用示性函数来计算。令示性函数,6.1.4 综合可靠度,则 就是 的数学期望,即这种综合度一般能较好地反应实际情况。但是上面这种定义比较复杂, 如 可能就不易求得; 有时可能采用加权平均的方法对综合可靠度做出估计, 当然这样的方法和经验有一定的关系.,6.1.4 综合可靠度,另外一种定义综合可靠度的方法是加权平均。当有不少因素影响可靠度时,可分别计算每个因素的可靠度,设为 ,然后用适当的加权系数 求加权和而得综合可靠度为 是加权系数。这种方法所牵涉积分是一维的,由之求得的 ,所以计算会简单一些。,