1、铁路信号可靠性原理及应用,江磊,第一章 绪论,第一节 可靠性、安全性在铁路信号中的地位第二节 RAMS简介第三节 可靠性工程和安全性工程第四节 现代质量观念第五节 铁路信号可靠性与安全性,1、 可靠性、安全性的地位,可靠性和安全性都是针对的工程上的问题,就是面向设备或系统而言。铁道信号的作用和功能决定了可靠性和安全性在铁路信号中的重要性。,可靠性、安全性的地位,回忆1、铁路信号基础设备有哪些?,2、铁路信号控制系统有哪些?,信号机、道岔、轨道电路、继电器等,车站计算机联锁、列车调度指挥系统、列车运行控制系统、编组站调车控制系统、微机监测系统化等,可靠性、安全性的地位,铁路事故的发生,造成严重后
2、果。事故原因可能是人为、设备、系统造成的,这些都是属于不可靠行为。,在铁路信号设备或系统设计时都要遵循“故障-安全”原则,可靠性、安全性的地位,“轨道交通安全协同创新中心”由西南交通大学和北京交通大学联合牵头,中南大学重点参与,三所学校共同组建。同时,积极吸纳多家轨道交通行业重要研究院所和骨干企业,作为协同创新中心的参与单位。,2、RAMS,可靠性:产品在规定的条件下和规定的时间内,完成规定功能的能力。维修性:产品保持或恢复所具有的功能反映到时间和所需资源上的特征。可用性:广义的可靠性,又和维修性有关。安全性:将伤害或损坏的风险降低到可接受水平的状态。,轨道交通RAMS各要素之间的关系,3、可
3、靠性工程和安全性工程,可靠性是一门新兴的工程学科。产品的可靠性已成为衡量产品质量的重要指标之一。近年来,世界各发达国家已把可靠性技术和全面质量管理紧密地结合起来,有力地提高了产品可靠性水平。可靠性的发展简介,可靠性的重要意义,(1)提高产品的可靠性,可以防止故障和事故的发生,从而保证人民生命财产安全。(2)提高可靠性,能使产品总的费用降低。 (3)提高可靠性,可以减少停机时间,提高产品可用率。(4) 提高可靠性,可以改善企业信誉,增强竞争力,扩大产品销路,从而提高经济效益。(5)提高可靠性,可以减少产品责任赔偿案件的发生,避免不必要的经济损失。,可靠性的基本概念,概率论和数理统计是研究可靠性问
4、题的主要工具。概率论能确定可靠性数量特性之间的相互关系。因此,可靠性理论的许多概念是与概率论中的概念密切相关的。而可靠性的测定则主要用的是数理统计方法。,Reliability Engineering,可靠性工程认为:产品、设备、系统在规定时间内,规定条件下,完成规定功能的可能性及能力,在期望的置信程度下,是可以设计、预测、试验和证明的。可靠性工程就是完成上述任务的理论与实践工具。,可靠性技术在产品全寿命周期的各个阶段的应用目的和任务是: (1)可靠性设计:通过设计奠定产品的可靠性基础。研究在设计阶段如何预测和预防各种可能发生的故障和隐患,以及确保产品的维修性 (2)可靠性试验:通过试验测定和
5、验证产品的可靠性。研究在有限的样本、时间和使用费用下,如何获得合理的评定结果,找出薄弱环节,提出改进措施,以提高产品的可靠性,(3)制造阶段的可靠性:通过制造实现产品的可靠性。研究制造偏差的控制、缺陷的处理和早期故障的排除,保证设计目标的实现。 (4)使用阶段的可靠性:通过使用维持产品的可靠性。研究产品运行中的可靠性监视、诊断、预测,以及采用售后服务与维修策略,防止可靠性劣化。,Multiple Activities,FRACA,FMEAS,Standards based preliminarypredictions,Reliability growth,Others,ReliabilityC
6、enteredMaintenance,Accelerated Testing,SystemReliabilityAnalysis,Life data Analysis,Reliability Engineering vs. Quality Control,Reliability deals with the behavior of failure rate over a long period of time.Quality control deals with percent out of specification, or percent of defectives at one poin
7、t in time, (i.e. when receiving incoming components, or at a point during the products manufacture/assembly).Reliability is quality over time.,Product Cost vs. Reliability,Reliability Basics,Reliability analysis requires a firm understanding of the products failure rate behavior.Most products will b
8、egin their lives with a higher failure rate and then exhibit a decreasing failure rate up to a point.The failure rate then usually stabilizes to a constant failure rate during the useful life of the product.As time goes on and the product ages, or reaches the wearout life, the failure rate then incr
9、eases rapidly with time.,“idealized” bathtub curve,Bathtub curve for a car,Burn-in illustration,Preventive maintenance,Quantifying reliability,Quantifying reliability,Probability that an item will last a certain time without “failure” under certain conditions.Function of timeFunction of conditionsRe
10、quires precise definition of “failure”.,Traditional “Quality Control” assures that the product will work after assembly and as designed. Reliability looks at how long the product will works as designed,How is reliability calculated?,Need data Need a modelNeed diagnostics to check model appropriatene
11、ssNeed effective ways to communicateCommon languageCommon metricsGraphs,可靠性的概率统计知识,概率论和数理统计是可靠性工程重要的数学基础。 2.l 可靠性特征量 可靠度可靠度是“产品在规定条件下和规定时间内完成规定功能的概率”。可靠度是时间t的函数,故也称为可靠度函数,记作R(t)。通常表示为 R(t)=P(Tt) (2-1-1) R(0)=1,R(+)=0。 R(t)的估计值为R(t)=,累积失效概率F(t)累积失效概率是寿命的分布函数,也称为不可靠度,记作F(t)。它是产品在规定的条件下和规定的时间内失效的概率,通常表
12、示为 F(t)=P(Tt) 或 F(t)=1R(t) 因此F(0)=0,F(+)=1。失效概率密度f(t)失效概率密度是累积失效概率对时间t的导数,记作f(t)。它是产品在包含t的单位时间内发生失效的概率,可用下式表示 f(t)= 或F(t)=,F(t)的估计值,f(t)的估计值,失效率 (t)失效率(瞬时失效率)是:“工作到t时刻尚未失效的产品,在该时刻t后的单位时间内发生失效的概率”,也称为失效率函数。由失效率的定义可知,在t时刻完好的产品,在(t,t+t)时间内失效的概率为P(tt),在时间 内的平均失效率为 当t 0时,就得到在t时刻的失效率,由此式可见,产品的失效率越小,产品的可靠性
13、越高;反之,失效率越大,产品的可靠性就 越低。 的估计值(见图2.3)为: 式中n(t)的含义与(218)式中的n(t)相同,n(t)、N与(212)式中的n(t)、N相同。,失效率的单位 是一个非常重要的特征量,它的单位通常用时间的倒数表示。但对目前具有高可靠性的产品来说,就需要采用更小的单位来作为失效率的基本单位,因此失效率的基本单位用一个菲特(Fit)来定义,1菲特=,它的意义是每1000个产品工作10h,只有一个失效。有时不用时间的倒数而用与其相当的“动作次数”、“转数”、“距离”等的倒数更适宜些。失效率曲线 产品的可靠性取决于产品的失效率,而产品的失效率随工作时间的变化具有不同的特点
14、,根据长期以来的理论研究和数据统计,发现由许多零件构成的机器、设备或系统,在不进行预防性维修时,或者对于不可修复的产品,其失效率曲线的典型形态如图24所示,由于它的形状与浴盆的剖面相似,所以又称为浴盆曲线(Bathtub-curve),它明显地分为三段,分别对应元件的三个不同阶段或时期。,2.1.4 平均寿命,平均寿命的含义是寿命的数学期望,平均寿命是一个标志产品平均能工作多长时间的特征量。如显像管、电视机、空调、计算机等常用平均寿命作为可靠性指标。不可修复(指失效后无法修复或不修复而进行替换)产品的平均寿命是指产品失效前的平均工作时间,记为MTTF(Mean Time To Failure)
15、;可修产品的平均寿命是指相邻两次故障间的平均工作时间,称为平均无故障工作时间或平均故障间隔时间,记作MTBF(Mean Time Between Failures)。如果我们仅考虑首次失效前的一段工作时间,那么二者就没有什么区别了,所以我们将二者统称为平均寿命,记作夕。若产品总体的失效密度函数(r)已知,由概率论中数学期望的定义,有 ( 2-1-12)进一步推导,得 (2-1-13)由此可见,在一般情况下,将可靠度函数在0,+ 区间上进行积分,便可得到产品总体的平均寿命。,MTTF的估计值为: (2-1-14) 式中 n 测试的产品总数; 第i,个产品失效前的工作时间,单位为h。 MTBF的估
16、计值为: (2-1-15) 式中 n测试的产品总数; N测试产品的所有故障数; ni第i个测试产品的故障数; tij第i个产品的第j1次故障到第j次故障的工作时间,单位为h。 因此MTTF和MTBF的估计值可表示为 :,2.1.5 寿命方差和寿命标准差,平均寿命能够说明一批产品寿命的平均水平,而寿命方差和寿命标准差则能够反映产品寿命的离散程度。 产品的寿命方差定义为: (2-1-17)假如t1,t2,tn为从一批产品中所抽取的n个样品的寿命数据,则这批产品的平均 寿命可用 来估计。而这批产品的寿命方差的估计值为: (2-1-18) 寿命均方差(标准差)为: (2-1-19),当n不大时,或对于
17、小子样来说,其寿命方差和标准差分别为: (2-1-20) (2-1-21),2.1.6 可靠寿命、中位寿命和特征寿命,当R(t)已知时,可以求出任意时间t的可靠度,反之,若确定了可靠度,也可以求出相应的工作寿命(时间)。可靠寿命就是指可靠度等于给定值r时产品的寿命,记作t(r),即Rt(r )=r。可靠寿命的表达式为: (2-1-22) 式中的 是R(t)的反函数。当R0.5时产品的寿命称为中位寿命,即: (2-1-23) 当只0.368时产品的寿命称为特征寿命,即: (2-1-24)从定义可看出,产品工作到可靠寿命t(r),大约有100(1r)的产品失效;产品工作到中位寿命t(0.5),大约
18、有一半失效;产品工作到特征寿命,大约有63.2的产品失效,对于失效规律服从指数分布的一批产品而言,其特征寿命就是平均寿命,因此约有63.2的产品将在达到平均寿命前失效,就是说,能够工作到平均寿命的产品仅占36.8左右。,2.2.1 维修度,维修度(Maintainability)是指在规定的条件下使用的产品发生故障后,在规定的时间(0,t)内完成修复的概率,记为M(t)。 M(t)=P(Yt)=G(t) (2-2-1)维修度是时间(维修时间t)的函数,故又称为维修度函数M(t),它表示当t=0时,处于失效或完全故障状态的全部产品在t时刻前经修复后有百分之多少恢复到正常功能的累积概率。,2.2.
19、2 修复率,修复率指修理时间已达到某一时刻但尚未修复的产品在该时刻后的单位时间内完成修理的概率,可表示为(t)。它是用单位时间修复发生故障的产品的比例来度量维修性的一个尺度。 (2-2-2)式中 m(t)维修时间的概率密度函数,即 (2-2-3)若M(t)服从指数分布,即 (2-2-4)则修复率为常数 。,2.2.3 平均修复时间MTTR,平均修复时间是指可修复的产品的平均修理时间,其估计值为修复时间总和和修复次数之比,记作MTTR(Mean Time To Repair)。 (2-2-5)若修复时间服从指数分布,如(2-2-4)式所示,则平均修复时间是修复率的倒数,即 (2-2-6)可靠性是
20、由设计、制造、使用等因素所决定的,而维修性是人为地排除故障,使产品的功能恢复,因而人为因素影响更大。维修性三特征量的估计值求法见例2.2.1。,例2.2.1 某电视机厂的维修站修理了该厂生产的20台电视机,每台的修理时间(单位min)如下:48,59,68,86,90,105,110,120,126,128,144,150,157,161,172,176,180,193,198,200试求:(1)160min的维修度;(2)MTTR;(3)120min时的修复率,t=15min。 解:(1) (2) (3),2.3 有效性特征量,有效性也称可用性。它是综合反映可靠性和维修性的一个重要概念,是一
21、个反映可维修产品使用效率的广义可靠性尺度。对许多军用晶(如军用微波电台、发电机组)来说,有效性是至关重要的,其反映有效的指标(有效度、可用率)乃是可靠性的第一指标。有效性表示可维修产品在规定的条件下使用时具有维持规定功能的能力。这里所指的规定条件包括产品的工作条件和维修条件。有效度是有效性的数量指标。,2.3.1 有效度,有效度(可用度)是指可维修的产品在规定的条件下使用时,在某时刻具有或维持其功能的概率。对于可维修的产品,当发生故障时,只要在允许的时间内修复后又能正常工作,则其有效度与单一可靠度相比,是增加了正常工作的概率。对于不可维修的产品,有效度就仅决定于且等于可靠度了。显然,有效度是时
22、间的函数,故又可称为有效度函数,记为A(t)。它又分为几种形式。(1)瞬时有效度(Instantaneous Availability):瞬时有效度指在某一特定瞬时,可能维修的产品保持正常工作使用状态或功能的概率,又称瞬时利用率,记为A(t)。它反映在t时刻产品的有效度,而与t时刻以前是否失效无关。瞬时有效度常用于理论分析,而不便于在工程实践中应用。(2)平均有效度(Mean Availability):可维修产品在时间区间0,t内的平均有效度指瞬时有效度A(t)在0,t内的平均值,记为 (t)。 (2-3-1),设备或系统在执行任务期间t1,t2的平均有效度,又称任务有效度,即: (232)
23、 它表示设备或系统在任务期间t1,t2可以使用的时间在时间区间t1,t2中所占的比例。(3)稳态有效度(Steady Availability):稳态有效度或称为时间有效度(Time Availability),又叫可工作时间比UTR(Up Time Ratio),记为A()或A。它是时间t趋于时瞬时有效度A(t)的极限,即 (234)稳态有效度也可表示为 A= (234) A (235),当可靠度R(t)和维修度M()均为指数分布,且MTBF 时,有 (236) 如上所述的瞬时、任务、稳态有效度之间的关系见图2.5。,(4)固有有效度(Inherent Availability):固有有效度
24、可表示为: A= (2-3-7) 式中 MADT(Mean Active Down Time)两次维修间平均不工作时间; MTBF平均无故障工作时间。 这是事后维修的公式,若是预防性维修,则上式中的MTBF应以平均维修时间MTTM(Mean Time To Maintenance)代替。 固有有效度也可表示为: 式中MTBM(Mean Time Between Maintenances)两次维修间平均时间; 平均维修时间。,提高设备或系统的有效度两条途径:一是提高设备的可靠性,延长设备的平均故障间隔时间MTBF;二是加强维修性设计,提高维修性,以缩短平均修复时间MTTR。,Insurance
25、company example,You objective is to write a life insurance policy for Chinese males.You want this policy to maximize profit!,Even thought most manufactures are not insurance companies, their responsibility is not much different since they “underwrite” every product they make (warranty).Unlike typica
26、l insurance, in addition to the financial (warranty) responsi-bility,(warranty) responsibility, manufacturers also take the legal and corporate image risks associated with failures.,Insurance Company Example,To intelligently reach your objective, you need to know the lifespan of the Chinese male.You
27、 need mortality data on Chinese males.You need a way to describe the data( model and metric)Model and metrics should adequately describe the lifespan of Chinese males.,Insurance Company Example,Assume that such data were obtained,then what?Is it sufficient to say that the average life span is ,based
28、 on the data, 71.9 years? If the objective is to insure twenty 50-year-olds and twenty 40-year-olds, does this help me in determining how much to charge?,Sample mortality data( years )48,58,65,68,72,74,81,82,83,88,Insurance Company Example,You need more information than just the average. You need an
29、 estimate of how many of the insured will survive the next year, given their current ages.Need to quantify:How the mortality rate varies across age groups.The expected number of deaths in each age group.,If we are dealing with a product, mortality rate is the same as a products failure rate.,Insuran
30、ce Company Example,You need a model that can be queried to provide the results of interest. In most cases, this model will be a probabilistic model i.e. provide information as probabilitysuch as :I expect 99.9% of 40-year-olds to survive the additional year.I expect 99.3% of the 50-year-olds to surv
31、ive the additional year.The model will describe the probability of survival ( reliability ).,Models,These models estimate the failure rate of the product as a function of time as well as the probability of failure( or survival ) of the product to a given age, or for a given period of time.The models
32、 are a mathematical representation of the data, given as continuous functions to allow for interpolation( and some extrapolation),Models,These probabilistic models are based on statistical distributions.Exponential Weibull normal A special subset called ” lifetime distribution ”, are most commonly u
33、tilized.,Models for Life Data,First, the model matters.We characterize models by their failure rate behavior.Failure rate is the chance of failing in the next small unit of time, given that the item operated that long.Failure rates can be increasing, decreasing, constant, ”bathtub” shaped or none of the above.Increasing failure rate implies wearout.Decreasing failure rate implies infant mortality.Bathtub implies infant mortality followed by wearout.,