1、以可靠性为中心的维修(RCM),山西漳山发电有限责任公司 2009年10月,一、检修技术的发展,二、检修与RCM,三、RCM在电力系统的应用,一、检修技术的发展,从20世纪30年代开始,检修技术的发展可以划分为三个阶段。,第一代,第二代,第三代,一、第一代,第一代,二战及以前,工业没有高度机械化,设备停运并不重要,管理者对于防止设备故障并不重视。,一、第一代,当时设备比较简单,安全和可靠性均过度设计,可靠性较高,易于检修,并不需要系统性的维修工作,仅仅是简单的清扫,保养和定期加润滑油等工作。,第二代,第二代,二战是转折点。战时对各种物资的巨大需求和人力的不足导致了机械化的快速发展。到了50年代
2、,机器不仅数量巨大而且越来越复杂,并且成为了工业的依赖。,第二代,由于工业严重依赖于各类机器,因此机器因故障停运成了人类关注的焦点。这就导致了“预防性检修”概念的出现。在60年代, “预防性检修”主要是指定期大修。,第二代,与其它运行费用相比较,检修费用随之快速增加,这导致了“检修计划和检修过程控制系统”的发展。同时人们也加大了对延长设备寿命的研究与投入。,第三代,从70年代中期开始,随着人类对设备要求的不断提高、新的研究成果和新技术的出现,检修技术又进入了新一轮快速发展期。,第三代,第三代,新的要求,从60,70年代起,在制造业,人们对设备的停运已经非常关切。到了当代,随着机械化和信息化的发
3、展,设备的可靠性和可用率成了一些行业关键的指标。,第三代,高度的自动化也意味着可能会有更多的故障威胁着我们能否达到满意的质量标准。,譬如医疗、数据处理、通讯和建筑管理行业。,第三代,有的故障会有严重的安全和环境方面的危害。在安全和环保标准日益严格的现代,设备安全直接关系到企业的生存。,第三代,在过去的三十年间,检修费用从无关紧要演变成了优先控制对象。近年来,在整个运行费用中,检修费用排在了第一或者第二的位置。,第三代,新的研究成果,新的研究成果颠覆了人们固有的许多看法,特别是关于运行时间和故障间的关系。,实际上对很多设备而言,设备出现故障的可能性与运行时间之间的关系并不大。,新的研究成果,19
4、40,1950,1960,1970,1980,1990,2000,第一代,第二代,第三代,人们对故障发生的可能性与时间的关系认识的演变过程,横坐标:运行时间 纵坐标:出现故障的可能性,第三代,第一代对“故障发生可能性”与“运行时间”之间关系的看法 :,随着时间的推移,设备出现故障的可能性逐渐增大。,第三代,第二代对故障的看法,对所谓的“婴儿死亡率”的认识导致了广为流行的 “浴盆曲线”的产生。,第三代故障研究结论p1,第三代故障研究结论:,共有六种故障模式存在,无论计划多么完美,很多按照传统理念进行的维修工作不仅毫无用处,而且甚至是事与愿违或者说是危险的。,第三代故障研究结论p2,对于冠以“预防
5、性检修”名字的工作而言尤其是如此,此外,还有更多的与现代化的、复杂的工业系统的安全运行密切相关的检修工作没有列入到检修项目中,第三代故障研究结论p3,工业领域在“如何做好检修工作”方面给于了极大的关注,即如何“将工作做好”,但是,更需要的是计划要做的工作是应该做的,即 “做该做的工作”,新的技术,1940,1950,1960,1970,1980,1990,2000,第一代,第二代,第三代,各种各样的检修技术不断出现,不断演变的检修技术,坏了再修,定期大修,计划与过程控制系统,状态监视,将可靠性和可维护性纳入设计,危害研究,故障模式和后果研究,专家系统,小型化,快速计算机的引入,大型,慢速计算机
6、的引入,故障技术,新技术主要包括:,决策支持工具 如:危害研究,故障模式与故障影响,专家系统等。,新检修技术 如:状态监视等。,故障技术,更加关注设备可靠性和可维护性的设计,从一个组织扩大到共同参与、团队协作和更具灵活性的合作,故障技术,现在维护人员面临的一个主要挑战不仅是学习掌握这些新技术,而且还要明白在本企业里,哪些技术是有用的,哪些是无用的。,故障技术,如果做出了正确的选择,那么在提高设备性能的同时也降低了设备的维修成本。 相反,则不仅会导致新问题的出现,而且现存的问题也会更加恶化。,故障技术,世界上首先开展检修决策系统研究的是美国的民用航空业,并形成了MSG3标准。在航空业之外的行业叫
7、作“以可靠性为中心的检修”,简称RCM。,故障技术,现在RCM已经成为工业界设备管理的最有效工具。除此以外,没有哪种技术可以保证以真实的、安全的、最少量的工作来保证设备的正常运行。,故障技术,美国汽车工程师协会(SAE)颁布的“RCM过程评价标准”(SAE Standard JA1011),这也是工业界RCM标准。,故障技术,二、检修与RCM,从工程师的角度来看,任何物理设备的管理都具有两个要素,就是设备需要定期的“维护”或“改进”。,二、检修与RCM,维护是指“使之保持现有状态,或使之能够继续。”,“改进”与“维护”间还有不少的差别。,字典中的定义:,二、检修与RCM,维护:保正设备能够持续
8、地完成使用者让其完成的任务。,对于具体的物理设备:,RCM:用于决定必须做哪些工作才能“保正设备能过持续地完成使用者让其完成的任务”。,故障技术,三、RCM的七个基本问题,在当前运行环境下,设备的功能和应到达到的性能标准是哪些? 设备为何完不成其应有的功能? 什么导致了设备功能失效?,故障技术,故障出现时会有哪些征兆? 每种故障的后果会是什么? 如何预测或者预防每种故障? 如果找不到一种合适的主动性预防手段如何办?,故障技术,1 功能和性能标准,在开始进行RCM工作之前,首先要做如下两件事 :,弄清要让设备完成什么工作,明确设备能够达到什么样的工作性能,故障技术,设备应具备以下两种功能,主要功
9、能,设备主要应具备的能力,包括:速度、出力、运送或者存储能力、产品质量以及服务水平等,故障技术,次要功能,如设备的安全性、可控制性、清洁性、舒适性、经济性、运转效率,以及是否符合环保标准和外观是否美观等,故障技术,毫无疑问,设备的使用者最清楚设备的各种功能,因此他们也是RCM过程自始至终的参与者。,故障技术,弄清设备功能这一步通常要占整个RCM分析过程三分之一的时间。,RCM团队在弄清楚设备究竟如何工作的过程中会有很大的收获,并且往往都是令人惊讶的收获。,故障技术,2 功能失效,维护工作的目的是以有效的方法管理故障,需要从以下两个层面开展工作:,弄清什么样的环境因素会导致设备发生功能故障,弄清
10、发生故障的原因,故障技术,功能失效也叫故障状态,除了完全失效,还包括部分功能失效(设备仍能工作,但性能指标已无法满足要求,包括产品质量和精确度)。,故障技术,显然必须要定义清楚设备功能和有关的性能标准后才能评判设备的功能失效问题。,故障技术, 故障模式,发现设备功能失效后的下一步工作就是弄清导致故障的各类可能原因。这些原因就叫故障模式。,故障技术,传统的故障模式包括由老化和正常磨损所导致的故障。其实也应该包括人为失误(运行人员或者维护人员)和设计缺陷。,故障技术,所有可能导致故障的原因都应弄清和认真对待。在避免因过度关注表象而不是根源而浪费时间和精力的同时,也应防止在对故障原因进行分析时,过于
11、注重细节。,故障技术, 故障后果,设备功能失效后会发生什么就是故障后果。为此应包括如下的相关信息:,有什么证据(如果有的话)能证明故障已经发生,故障技术,可能会给安全和环境带来哪些(如果有的话)危害,可能会对生产和运行带来哪些(如果有的话)影响,故障后可能带来哪些(如果有的话)物理性的损坏,故障后应进行哪些修复工作,故障风险, 故障风险,每个企业都有很多种故障模式,他们都会对企业带来或多或少的影响。可能会影响到产品质量、客户服务、安全或者环境,这都需要时间和金钱去处理。,故障风险,如果这种影响很严重,就需要认真对待;反之如果影响不大或者没有什么影响,除了基本的清扫和加注润滑剂外,就无需增加更多
12、的维护工作。,故障风险,中认为,采取任何一类主动型检修工作的原因并不在于避免故障本身,而在于避免或者是减轻因故障而导致的后果。,故障技术,隐蔽型故障风险,此类后果尽管并没有直接的影响,但是它们可能会给企业或组织带来巨大的,甚至是灾难性的后果。很多此类故障都与采用“非故障安全型”保护装置有关。,故障风险,安全、环境风险,可能致伤或者使人死亡的后果叫安全性风险。 可能会导致企业、局部或者区域性环境破坏的叫环境性风险。,故障风险,运行风险,运行后果是指对生产,包括产量、产品质量、服务、运行成本或者直接的维修费用等产生影响的风险。,故障风险,非运行风险,指对安全和运行均无影响的故障后果,仅仅是维修费用
13、的问题。,故障风险,上述关于故障风险的分类是中关于维修工作决策的基础。,风险评估过程中并不认为所有的故障都是坏的和必须避免的。而是将精力集中在对企业影响最大的故障上去。,故障风险,这也促使我们在更广的范围内思考如何管理故障,而不是死盯着如何避免故障不放。,故障管理技术可以分为以下两类:,主动性工作 默认工作,故障风险,主动性工作,指为避免设备进入故障状态,而在故障发生前采取的工作。这包含了传统的“预测性”和“预防性”检修,在RCM中使用了诸如:计划性恢复,计划性更换和状态检修等概念,故障风险,默认类工作,在故障状态已经出现,或者无法选择有效的主动性检修方案的情况下,采取默认工作,包括:故障查找
14、、重新设计和运行至出现故障再检修等。,故障风险,主动性工作,很多人认为:保证设备可用率的最佳途径是定期开展主动性的维护工作。 在第二代的检修技术中就是“定期大修”和“定期更换备件”,新的研究成果,这张图基于一个观点,即大部分设备在一个时间段“X”内都是可靠的。,新的研究成果,传统的理论认为,通过对大量的故障记录分析就可以找到这个寿命周期,从而在故障发生前采取预防性的工作。,新的研究成果,对于简单设备,或者有主导性故障模式的复杂设备而言该模型是成立的。与运行时间有直接关系的故障,包括:疲劳、腐蚀、磨损和衰减等。,新的研究成果,由于设备越来越复杂,实际上对于各类电气或者机械设备而言,共有六种故障模
15、式,新的研究成果,A:浴盆曲线 B:随时间而增大 C:逐渐变大,无明显老化区 D:开始低,逐渐趋于稳定 E:与时间无关(随机型) F:开始故障高,逐渐趋于稳定,A,B,C,D,E,F,新的研究成果,民用航空业研究表明,各种故障模式所占比例为:,A,B,C,D,E,F,新的研究成果,民用航空业研究结果与人们通常所想的正好相反。人们通常认为设备大修次数越多,就越不会损坏。,新的研究成果,现在,这样的观点很少是正确的。除非设备存在有与时间占主导因素的故障模式,否则按照运行时限进行检修对于提高复杂设备的可靠性几乎没有作用。,新的研究成果,实际上,定期大修由于会带来所谓的初生风险(婴儿死亡率)往往会增加
16、一个稳定系统的故障几率。,基于上述认识,有的企业干脆抛弃了主动性维修。,新的研究成果,不采取主动性维修对于风险不大的故障而言是没有问题的。但对于可能有较大风险的故障而言,必须要预防和预测这些故障,或者至少是降低故障的风险。,新的研究成果,这就又回到了主动性工作了,如前所述,在RMC中此种工作被分为三类:,计划性恢复 计划性更换 计划性的状态检修,新的研究成果,计划性恢复 定期检修,无论设备当时状况如何。,计划性更换 定期更换设备,而不管该设备当时状况如何。,新的研究成果,这两种“预防性检修”方法曾经被广泛应用,但由于上述原因,与20年前相比,现在应用的少多了。,上述两种方法现在被称为“预防性检
17、修”。,新的研究成果,状态检修 近年来一些新的技术应运而生,他们均基于这样一个事实:大多数的故障在其发生前都会有一些征兆。,新的研究成果,这些征兆也叫作“潜在故障”,即表征设备正要发生功能故障或正在故障发展过程中的一些可识别的物理状态。,新的研究成果,用于检测“潜在故障”的技术叫作状态检修技术。之所以叫状态检修是因为设备只要在能够满足性能指标状态下运行就可以继续工作。,新的研究成果,状态检修包括:预测性检修,基于状态的检修和状态监视,如果能够利用好这些技术,状态检修将是故障管理的有力工具,当然这需要花费大量的时间和精力。,故障风险,默认工作,相对于主动性工作,默认履行工作包括以下三类: 故障查
18、找、重新设计和运行至出现故障再检修。,故障风险,故障查找 定期检查设备的隐藏功能,以确定它们是否已经出现了故障。而状态检修是检查那些正在发生的故障。,故障风险,重新设计 对系统和设备进行重新设计,包括硬件和程序的更改。,故障风险,非计划性的检修 也叫运行到故障再检修,主要针对那些无严重后果的故障,可以不采取任何的预防措施,允许出现故障后再维修。,故障风险,RCM工作任务筛选,RCM的一个优点就是能够提供一种简单、准确和易理解的任务遴选方法。在任何背景下,通过该方法可以方便地找到技术上可行的主动性检修方案。,故障风险,设备及其要预防的故障的技术特点决定了主动性检修方案是否技术上可行。,而是否值得
19、去做,则取决于该方案能否很好地控制故障带来的风险。如果技术上不可行且不值得去做,那么就应选择一种适合的默认处理方案。,故障风险,设备及其要预防的故障的技术特点决定了主动性检修方案是否技术上可行。,而是否值得去做,则取决于该方案能否很好地控制故障带来的风险。如果技术上不可行且不值得去做,那么应选择一种适合的默认处理方案。,故障风险,隐含型故障,如果有一种主动性检修方案能够将故障导致的风险控制在一个可以忍受的范围内,那么就可以选择该方案。否则就应进行计划性的故障查找工作,如果也没有,那就应考虑重新设计该设备(取决于故障的风险情况),故障风险,安全和环境故障,只有在一种主动性检修方案能够将故障导致的
20、风险控制在一个极低水平前提下(如果不能完全消除的话),才可以选择该方案。否则就必须重新设计或改进有关的工艺流程。,故障风险,运行型故障,如果在一定期间主动性检修费用低于同期内因运行型故障可能造成的损失和维修所花的费用,那么主动性检修是有必要的。即必须要进行经济性评估,如果不划算,那么默认的做法是不进行计划性维修,也可以考虑优化设计。,故障风险,非运行型故障,如果在一定期间主动性检修费用低于同期内因运行型故障可能造成的损失和维修所花的费用,那么主动性检修是有必要的。即必须要进行经济性评估,如果不划算,那么默认的做法是不进行计划性维修,也可以考虑优化设计。,故障风险,上述方法表明,应根据故障情况,在确实需要主动性检修工作情况下,才进行该工作。这不仅能减少大量定期工作的工作量,也可以腾出时间从事其他有用的工作,从而提高工作效率。,