作为中国自动化领域的权威旗舰网络媒体,控制网创立于1999年7月,是中国举行的第十四届IFAC (International Federation of Automatic Control)大会的中国官方组织机构的唯一指定网站。控制网是中国自动化学会专家咨询工作 委员会(ECC)的秘书处常设之地。是北京自控在线文化传播有限公司开设的网站。
标题 | 谈谈分散型控制系统的可靠性 |
技术领域 | |
行业 | |
简介 | 介绍了分散型控制系统的可靠性及可靠性指标,并进一步阐述系统的可靠性分配和可靠性设计方法。 |
内容 |
1 概述
可靠性是分散型控制系统(DCS)最重要的技术性能指标之一。现代生产的连续性、快节奏和高效率对分散型控制系统的可靠性提出了很高的要求。由于分散型控制系统的硬件和软件结构都比较复杂,它的可靠性问题也涉及到更多的层面,应当重点进行讨论和研究。
2 分散型控制系统的可靠性问题
1 概述
分散型控制系统的可靠性是评估分散型控制系统的一个极其重要技术性能指标。通常,制造厂商提供的可靠度数据都在99.99%至99.9999%。由于可靠性指标具有统计特性,因此,在评估系统可靠性时,可以采用那些提高系统可靠性的措施来分析。除了系统制造时应该保证符合设计要求外,通常可以从可靠性设计和维修性两个方面进行分析。 2.1 可靠性及可靠性指标
1 概述
可靠性指机器、零件或系统,在规定的工作条件下,在规定的时间内具有正常工作性能的能力。狭义的可靠性指一次性使用的机器、零件或系统的使用寿命。分散型控制系统的可靠性是指广义的可靠性。它是可修复的机器、零件或系统,在使用中不发生故障,一旦发生故障又易修复,使之具有经常使用的性能。因此,它还包含了可维修性。常用的可靠性指标有:可靠度、MTBF、MTTF及故障率。 (1)可靠度:可靠度是衡量系统可靠性高低的重要指标之一。指机器、零件或系统,在规定的使用条件下的工作周期内,达到所规定的性能,即无故障正常工作状态的概率,用R(t)表示。
(2)MTBF:平均故障间隔时间指可以边修理边使用的机器、零件或系统,相邻故障期间的正常工作时间的平均值。它是一个时间指标,表示在两次故障之间的平均间隔时间。它和可靠度及失效率间的关系是:平均故障间隔时间为失效率的倒数,数值为可靠度曲线下的面积。
(3)MTTF:到发生故障的平均时间指不能修理的机器、零件或系统,至发生故障为止的工作时间的平均值,即指不可修理产品的平均寿命。
(4)故障率:通常指瞬时故障率。它是指能工作到某个时间的机器、零件或系统,在连续单位时间内发生故障的比例,用λ(t)表示。又称失效率、风险率。
对多数元部件来说,λ(t)随时间的变化曲线为“浴盆曲线”,如图一所示。曲线纵坐标是元部件的失效率,横坐标是时间。平行于横坐标的一条虚线为设备规定的失效率,该虚线与浴盆曲线的两个交点,将曲线分成三段,反映了设备的三个失效期。
图一 元部件的典型失效曲线
① 早期失效期
设备启用初期,失效率很高,很快就低下来了。这种失效阶段主要是由设计、制造、加工装配等内部缺陷造成的。通过这一时期产品失效的分析,可以改进设计、制造、加工装配等薄弱环节,提高设备的可靠性。
② 偶然失效期
经过早期失效期后,设备对规定的使用条件已能适应,设备失效率最低,并且稳定,且持续时间较长,这时失效率接近常数。这种失效阶段,一般只是出于偶然的因素,如突然过载、碰撞等事故性原因才导致失效。
③ 损耗失效期
经过一段时间的使用,设备上的某些零部件出现老化、磨损,因而设备的失效率随时间而上升。
需要强调指出,“浴盆曲线”反映了系统的一般失效规律,它经历了三种不同的失效类型。但对于某一单一的零件、元件或材料,它的失效只是上述三种失效类型中的某一种。
2.2 可靠性的计算
1 概述
分散型控制系统由大量的设备、元器件组成。它的可靠性可由组成系统的各部件通过串联、并联、旁路、桥接和分解的各子系统可靠性计算,然后按全概率法则求得。 (1) 串联系统可靠性
n个元件A1、A2┅┅An组成串联系统,各元件的失效相互独立,且系统中的任一个元件发生故障都会导致整个系统失效。如图二所示。若各元件可靠度分别为R1、R2┅┅Rn,失效时间分别为X1、X2┅┅Xn,则串联系统的失效时间X=minXi,可靠度R(t)为各串联元件可靠度的乘积。即:R(t)=∏Ri(t)(i=1,2┅┅n)。因此,串联系统的可靠性低于组成系统的每一个元件的可靠性。
图二 串联系统结构模型
(1) 并联系统可靠性
1 概述
n个元件A1、A2┅┅An组成并联系统,只要有一个元件正常工作整个系统就能正常工作。如图三所示,若各元件可靠度分别为R1、R2┅┅Rn,失效时间分别为X1、X2┅┅Xn,则并联系统的失效时间x=maxXi,可靠度R(t)为:R(t)=1-∏[1- Ri(t)] (i=1,2┅┅n)。因此,并联系统的可靠性高于组成系统的每一个元件的可靠性。
图三 并联系统结构模型 图四 表决系统结构模型
(3) (k,n)表决系统可靠性
1 概述
由n个元件组成的系统,若有k个或k个以上元件能正常工作,系统就能正常工作,则称为(k,n)表决系统。如图四所示,可以说,并联系统是(1,n)表决系统,串联系统是(n,n)表决系统。 (4) 冗余系统可靠性
1 概述
冗余系统又称备用储备系统,系统中有n个相同的部件,一个部件工作,其余部件备用。根据备用部件是否运行分为热后备和冷后备两类。 冷后备冗余系统中,只有一个部件处于工作状态,其它的部件都处于非工作的待命状态。当工作的部件出现故障时,处于待命的部件立即转入工作状态,直到全部部件失效。冷后备冗余系统的MTBF是各组成部件的MTBF(i)之和。
热后备冗余系统中,所有的部件一开始就同时工作,但一部件处于正常工作状态,其余部件处于备用工作状态,在该系统中,只要不是全部部件失效,系统就可以正常工作。反之,只有每个部件都同时失效时,系统才可能失效。因此,冷后备冗余系统比热后备冗余系统具有高可靠性。
2 分散型控制系统可靠性设计
1 概述
分散型控制系统在整个设计、制造过程中,采用了多种可靠性技术。从DDC到DCS的设计思想就是把危险分散,使局部故障的发生不影响全局的运行;高集成度的LSI是提高MTBF的重要措施;标准化、模块化设计、冗余技术、自诊断技术、容错技术、加密技术、抗干扰技术、表面安装技术、掉电保护技术等新技术的开发大大提高了系统的可靠性。因此可靠性设计是保证分散型控制系统可靠性最为重要的一步。 2.1 可靠性设计的要求和准则
1 概述
可靠性设计是完全新型的一种设计。它是用于实现设计质量,即可靠性、性能、效率、安全、经济等项指标的设计。采用可靠性设计,就能设计出在使用过程中不易发生故障、即使发生故障也易修复的产品。 一、通常,在可靠性设计时,要求做到以下几点:
(1) 有效地利用以前的经验,并进行适当的和适时的创新;
(2) 尽可能减少零件件数,尤其是故障率高的零件数;
(3) 采用标准化的产品;
(4) 检查、调试和互换容易实现;
(5) 零件互换性好;
(6) 采用可靠性特殊设计方法,进行可靠性预测、可靠度合理分配、冗余设计、安全装置设计、极安全设计等。
二、基于以上要求,分散型控制系统可靠性设计的基本准则主要有:
(1) 系统不易发生故障的准则
这条准则是重要的可靠性设计准则。即从系统的基本部件入手,提高系统的MTBF。
(2) 系统运行不受故障影响的准则
这条准则包含两方面的内容。冗余设计可以使系统某一部件发生故障时能够自动切换;多级操作、手动操作可以使系统某一部件发生故障时能够旁路或者降级使用。
(3) 迅速排除故障的准则
这条准则是重要的维修性设计准则。它包括故障诊断、系统运行状态监视、故障报警和隔离、部件在线带电更换等设计,用于缩短系统的MTTR。
2.2 可靠性分配
1 概述
系统的可靠性分配,则是已知系统的可靠性指标,求系统各组成元件的可靠性指标,可靠性分配的目的是为了落实系统设计的可靠性指标,明确对各组成单元的可靠性要求。因此,它是系统可靠性设计的重要环节。可靠性分配按照分配原则的不同,有等同分配法、加权分配法和动态规划最优分配法等。 (1) 等同分配法
等同分配法是一种最简单的分配法,它按照全部子系统可靠性相等的原则进行分配。此方法计算简单,缺点是没有考虑各单元现有的可靠度水平、重要性等因素。
(2) 加权分配法
加权分配法是考虑到各子系统在整个系统中的重要程度,以某子系统出现故障会引起整个系统发生故障的概率大小为依据,来分配该子系统的可靠度的分配方法。
(3) 动态规划最优分配法
动态规划最优分配法是以系统的成本、重量、体积或研制周期等尽可能小为目标,而以可靠度不小于某一最低值为约束条件,进行可靠度分配;或以系统可靠度尽可能大为目标,而把系统的成本、重量或体积等作为约束条件进行可靠度分配。
3.3 分散型控制系统可靠性设计方法
1 概述
根据可靠性设计要求和准则,分散型控制系统可靠性设计方法可从硬件和软件两方面入手。 3.3.1 系统硬件可靠性设计方法
(1) 系统不易发生故障的硬件设计
分散型控制系统硬件不易发生故障的设计,可从系统的以下几个组成部件考虑,以提高系统的使用寿命。
① 运动部件:在分散型控制系统中,运动部件的寿命直接关系到系统可靠性的指标。由于电子元器件的使用寿命比机械运动部件的使用寿命长。因此,对于运动部件部分的设计和选型应尽量采用电子元器件,以提高可靠性。
② 接插卡件:接插卡件在分散型控制系统组成中占很大比重。它的可靠性会直接影响全系统的正常运行。因此,在分散型控制系统中,接插卡件的设计方面常采用最先进的表面安装技术、密封结构、金属板外部散热设计、卡件的分散独立供电方式等,确保卡件运行在正常工作状况,大大地提高了卡件的可靠性。
③ 元器件:元器件是分散型控制系统的最基本组成元素。选用名牌工厂生产的高性能、规格化、系列化的元器件,如大规模集成电路、超大规模集成电路、微处理器芯片、耐磨损传动器件等。
④ 电路优化设计:采用大规模和超大规模的集成电路芯片、优化性能的元器件和连接线优化布置等电路优化设计不仅可以提高系统可靠性,而且可以防止和降低干扰的影响。此外电路优化设计还包括使分散型控制系统设计成多级控制系统的总体设计,它可以使系统在发生局部故障时能降级控制,直到手动控制。
⑤ 此外,机柜和操作台的优化设计等也不同程度地影响整体系统的可靠性。
(2) 系统运行不受故障的硬件设计
1 概述
冗余结构设计是保证系统运行不受故障的重要方法。它是以投入相同的装置、部件为代价来提高系统可靠性的。在分散型控制系统中,越是处于下层的部件、装置或系统越需要冗余,越需要高的冗余度。一般地,分散型控制系统的硬件冗余结构设计包括: ① 供电系统的冗余:包括系统外部供电和系统内部供电。在分散型控制系统中,常采用双重化供电方式。对自动化水平高的大型分散型控制系统的冗余供电系统也可以采用多级并联供电。
② 过程控制装置的冗余:过程控制装置的冗余分为装置冗余和CPU处理器冗余两类。装置冗余通常用n:1冗余方式。CPU处理器冗余常为双重化冗余,采用热后备方式工作。
③ 通信系统的冗余:几乎所有的分散型控制系统都采用双重化的通信冗余结构。在分散型控制系统中,控制站、操作站和上位机等所有存在数据通信的部位都采用了冗余结构,以确保数据通信的可靠性。
④ 操作站的冗余:常采用2-3台操作站并联运行,组成双重化冗余或(2,3)表决系统冗余。
⑤ 此外,系统输入输出信号的接插卡件、上位机也可以组成冗余结构。
(3) 迅速排除故障的硬件设计
1 概述
为了迅速排除故障,减小MTTR,除了具有足够的备品备件以及提高维修人员技能外,在硬件设计方面可采用下列措施。 ① 系统自诊断:分散型控制系统中的自诊断功能通常由硬件和软件共同完成。一个性能良好的分散型控制系统应具有很强的自诊断功能,它能够对各种接插卡件进行诊断,并显示故障。这样,维护维修人员能及时迅速地排除系统故障。
② 方便和可靠的硬件设计:对需常检修和更换的部件常采用接插卡件镀金的插脚、易于接插的把手,插卡滑轨等机械设计,以保证有良好的接触和易于更换的机械性能。在电子线路设计方面,采用各卡件自成系统,它的插入和拔出不影响其他卡件的运行,保证系统带电运行情况下,能更换接插卡件。
③ 专用诊断、检修设备:为了便于诊断和检修,大多数分散型控制系统制造厂商还制造了专用设备,用于在线和离线检查和修理。有些设备还可以进行仿真运行。
3.3.2 系统软件可靠性设计方法
(1) 分散结构设计
把整体的软件设计分散成各子系统的设计,各自独立,又共享资源。这种分散结构的软件设计既有利于设计工作的开展也有利于软件的调试。
(2) 容错技术
在软件设计中的容错技术是指在软件设计时,对误操作不予响应的技术。这里的不予响应是指对于操作人员的误操作,如不按设计顺序则软件不会去输出操作指令,或者输出有关提示操作出错的信息。
(3) 标准化
采用标准化的软件可以提高软件运行的可靠性。它还为其他软件公司的软件产品移植、应用提供了条件。目前,新一代的分散型控制系统在硬件上大多采用全32位的CPU芯片,而软件上则采用著名的多用户分时操作系统,如UNIX。采用windows编辑技术软件和关系数据库,如ORACLE等。
3 结束语
1 概述
分散型控制系统已大量应用于工业生产过程的控制和管理。随着工业规模的不断扩大,对分散型控制系统可靠性的要求也越来越高。分散型控制系统硬件和软件的可靠性设计已取得了明显的效果。 参考文献:
[1] 侯朝桢.分布式计算机控制系统[M].北京:北京理工大学出版社,1997.
[2] 何衍庆,俞金寿.集散控制系统原理及应用[M].北京:化学工业出版社, 2002.
[3] 王树青.工业过程控制工程[M].北京:化学工业出版社,2003.
[4] 应锦春.现代设计方法[M].北京:中国科学技术出版社,1990.
[5] 张德泉.集散控制系统[M].北京:中国石化出版社,1997.
|