企业简介

作为中国自动化领域的权威旗舰网络媒体,控制网创立于1999年7月,是中国举行的第十四届IFAC (International Federation of Automatic Control)大会的中国官方组织机构的唯一指定网站。控制网是中国自动化学会专家咨询工作 委员会(ECC)的秘书处常设之地。是北京自控在线文化传播有限公司开设的网站。

  • 公司类型:其他

联系方式
  • 控制网
  • 地址:北京市海淀区上地十街辉煌国际2号楼1504室
  • 邮编:100085
  • 电话:010-57116291 / 59813326
  • 传真:010-59813329
  • 网址:http://www.kongzhi.net
  • Email:mahongliang@kongzhi.net
  • 联系人:市场部
案例详细
标题现场总线物理层诊断的发展现状和方向
技术领域PLC&PAC
行业
简介
内容


作者简介:彭瑜(1938-),男,湖南长沙人,教授级高级工程师,1960年毕业于清华大学动力系,长期从事工业过程控制系统的研究开发工作,1993年获国务院特殊津贴,现任中国自动化学会仪表与装置专业委员会常务委员,上海市自动化学会常务理事,中国仪器仪表学会专家委员会委员。

    摘  要:
本文从现场总线诊断技术的发展进程、物理层诊断的必要性、物理层诊断的基本原理和诊断工具、现场总线可能发生的故障类型分析和故障检测的高级测量技术等方面,阐述保障现场总线系统健康应用的一个重要方向的内涵及其扩展。
    关键词:现场总线;物理层;故障;诊断

    随着现场总线技术的发展,现场总线网络及其相关网络设备以及现场总线仪表和设备的应用,在质量和数量上都有长足的进展。这些日益广泛和深入的应用,印证了美国ARC咨询集团“使用现场总线可以节省安装和工程成本,但最大的利益还是体现在生产装置投运之后长期的维护和运行中”的论断的正确性。显然,在长期运行和维护中使用现场总线带来的利益主要来自三个方面,即现场智能仪表和设备为工厂企业的资产设备管理提供了基本信息和实时信息;将现场仪表和设备的维护从被动的遇到故障才采取维护措施,提高到实施主动的预测性维护和预防性维护,大大减少了非计划停车所造成损失;为生产的平稳操作和加快生产节拍准备了技术条件。

    本文着重讨论现场总线的故障诊断技术的问题,特别是物理层诊断的问题。这不但是因为大量现场应用所发生的影响现场总线系统正常运行的故障主要是物理层的问题,提高故障诊断和排除的速度对使用现场总线的生产设备的正常运行关系极大;而且还在于我国在应用现场总线技术开发控制系统的单位和人员的水平,以及系统的维护人员的水平参差不齐,有时候为了压低成本或者常常是无知,没有遵照现场总线应用和安装的基本规范的要求,导致现场总线系统的长期处于非健康的状况。

    据Profibus国际组织对全世界范围内300多个现场的调查统计,Profibus-DP故障率最高的5点原因中至少有四方面属于物理层所产生的问题:

    未接终端电阻或终端电阻不合要求(物理层);

    动力线对信号线的影响,如靠得太近(物理层); 

    没有遵循通信电缆的布线规则(物理层);

    组态出现故障;

    接口损坏或采用了未经认证的接口(物理层)。

    这足可为上述物理层诊断的必要性给出佐证。

    1 
现场总线诊断技术的发展进程

    从上世纪70年代起,现场仪表和控制系统的诊断最初仅仅是一些输出信号和I/O状态是否正常等简单的诊断,之后HART技术的问世为仪表和过程诊断带来了许多新的概念和方法。不过,限于HART的主从通信机制及其处理能力和带宽的限制,致使HART仪表的诊断能力有限,只能发出诊断报警,较为详细的故障信息还必须由主机发出查询后才可发出,因此有人将此归类于所谓“被动式诊断”。自从90年代现场总线技术的发展,随之带来了较为复杂的传感器和过程诊断的加速,例如对于FF智能仪表其诊断数据是作为设备反馈信息的一部分不断地在刷新。直到最近几年才出现了高级物理层诊断,整个系统的监控范围大为扩展,不但可以对故障做出诊断,而且还能够对那些尚未发生故障、但有可能发展为故障的一些问题发出预警。这就是诊断技术的进展历程(见图1)。
 

图1现场仪表和系统的诊断技术的进展历程
[1]
 
    与此同时,无线技术的工业应用的迅速发展,尤其是无线HART的协议公布和产品推出,又为HART仪表诊断先进、但带宽受限给出了新的诊断信息的传送通道。典型的HART仪表包含35~40个数字数据项,其中有最多可有4个过程测量值,以及仪表设备专用的诊断信息(如接线故障、电子电路故障、超出测量范围等),它们都可以被用来改善工业生产的绩效。图2示出了这个思路[2]


图2  无线HART为智能HART数据给出了新的信传送通道
 
    近些年来总部设在德国的过程工业自动化技术的用户组织NAMUR十分活跃,提出了许多推荐型技术文件,受到全球业内人士的重视和推崇。其中《现场设备的自监测和诊断》(文件号:NE 207)[3]就是专门针对现场仪表变送器和执行器提出的自监测和诊断要求,为发展现场仪表的诊断技术给出了指导性的意见。

    2
  物理层诊断的必要性

    当决定采用现场总线控制系统的方案后,在施工、调试投运和正式运行等各个阶段,都对其测试和诊断技术和工具有迫切的要求。这使现场总线诊断的发展有了明确的发展方向。尤其是现场总线系统投运以后,不少用户反映,通信似乎是一个黑盒子,当主系统上指示产生了一个故障或发生了一个报警事件,常常不知道该如何处理。而实际上最常见的现场总线问题是:从物理层的角度看,现场总线设备不处在通信状态,最坏的是某个设备周期性的出现不参与通信的情况;从应用层的角度看,存在传输过来的是无效数据(数据测量值未作校验或有问题)。有些问题如I/O出问题可以由现场总线设备本身进行诊断。

    现场总线的网络通信出现故障,可以使用哪些工具或方法来查找故障呢?

    目测(观察现场总线设备上的指示灯)是最基本的诊断。以Profibus-DP为例,绝大多数设备上有3个发光二极管指示灯:ON,BF,SF。这些LED对维修人员极为重要,通过它们可以明确判断设备的状态。不过,大多数Profibus-PA仪表没有LED指示灯,因为由总线供电,要节省功耗以及考虑防爆的功率限制。

    而且这种指示只能告诉用户发生了某种故障,常常不能给现场总线的维护人员指示问题究竟出在哪里。最重要的工具当然是网络分析仪,但这类昂贵的仪器需要较深的专业知识,在现场使用颇多不变,因此难以普及。所以发展更有效的诊断工具就提到了日程上。

    从现场总线诊断的视角看,可以将目前在工业通信中运用的现场总线划分为三大类:①从自动化仪表发展过来的现场总线,主要是HART、FF的H1和Profibus-PA;②从PLC的远程I/O发展过来的现场总线,主要有Profibus-DP、DeviceNet和CC-Link等,这里又可细分为基于RS 485的现场总线和基于CAN的现场总线。③专为运动控制应用开发的现场总线,如SERCOS、EtherCAT、PowerLink等。运动控制用现场总线发展较晚,目前有关的诊断工具的开发主要从网络分析在发展,作为诊断工具尚有待于提到议事日程。前两类现场总线的应用都有了很大的范围,对诊断的需求呼声很高,所以近年来发展较快。它们的物理层的原理相似,但机制有较大不同,诊断工具自然不会一样。在以下的分析中将把它们分别展开。

    3  物理层诊断的基本原理和诊断工具

    以FF H1和Profibus-PA为例,其物理层由以下部分组成:主干电缆或主连接电缆,分支电缆或仪表连接电缆,端子排,置于主干电缆两端的终端电阻器,现场总线的电源,设备接口硬件,故障保护装置(如网段保护器等),现场总线通信的物理学(如信号等),图3给出了物理层的构成[2]

         

图3  FF H1和Profibus-PA物理层的构成
 
    由此可以推断,物理层诊断就是将诊断测试设备通过现场总线主干电缆与现场总线网络直接连接,来连续测试、监控和诊断整个网络,及时发现网络中各个物理部件的性能是否变坏或偏离,以防止由此引起故障或整个网段通信中断。图4示出在线诊断模块在现场总线系统中的位置。还可以通过物理层诊断来证实网络是否符合或一直符合现场总线标准,以及严格的设计规则。

    就其功能而言,物理层诊断工具可以分为:①简单手持式诊断设备:离线测试和初步诊断。②基本在线诊断设备:可在调试投运时进行初步的故障诊断,并可一直连在现场总线网络上以检测运行时的故障和查找报经原因。③移动式高级在线诊断设备:可在调试投运期间,甚至当控制系统和相关的现场总线电源都不能使用时进行高级测试,或在运行期间作详细的故障查找。④高级在线诊断设备:可在现场总线网络施工、调试投运和系统测试时,查找故障,按用户定义的方式报告/制作技术文档,以及早期给出故障预警。该设备永远与现场总线网段相连,并在整个现场总线网络的生命周期一直在工作。表1给出这四种诊断工具的功能比较表。

  
          

图4  将在线诊断模块通过现场总线主干电缆接入现场总线系统
 
    所谓基本物理层诊断范围包括DC电压、DC接地、高频、数据信号。而高级物理层诊断范围:除基本物理层诊断范围包括的项目外,还能诊断全部波形、AC波动情况、连线DC电流、数据的极性、AC不平衡和将波形存贮起来仔细分析(存贮示波器功能)。采用高级在线物理层诊断的优越性在于可测试和连续测试现场总线网络的通信质量,通信电缆的基本设施状况,现场总线用的电源、终端器和其他设备的工作状态,网段中所有的电子电路。这样一来,对于用户而言,现场总线的运行状况是可见的,透明的。一方面可加速调试运行的时间,并具有自动生成技术文档的能力。另方面可测试现场总线系统的性能,在控制室内通过对现场总线运行状况的监测,及时发现FCS的变化,在现场总线系统存在隐患、有可能对生产造成不良影响之前,就能发现问题,及时排除。

    目前已将高级物理层诊断功能集成到现场总线FF H1的供电电源母版上,这主要是用一个在线物理层诊断模块同时监测几个现场总线网段,可进一步降低成本。考虑到诊断性能、设备的复杂性和硬件成本的折中,P+F公司的FieldConnex高级物理层诊断模块设计成一个模块可同时对4个网段进行诊断,并将它集成到现场总线的供电电源中,作为标准电源产品供货。近年来Emerson和横河等DCS供应商与P+F均签有这方面的技术转让协议。用户可以直接从这些厂商订购带高级物理层诊断的FCS系统。目前物理层高级在线诊断还仅用于流程工业现场总线的FF H1和Profibus-PA,而其他的现场总线诊断大都是移动式高级在线诊断。
 
表1  四种诊断工具的功能比较表
测       量
移动式高级诊断
高级在线诊断
手持式现场总
线测试仪
基本在线诊断
潜在故障早期诊断用所有测量项目随时间的
去世与记录
 
 
 
 
有(有限)
主干电缆电流测量

抖动测量

数据信号幅度

屏蔽对信号±极的AC和DC不平衡(%)

±极间直接短路

全频谱分析

无(部分有)

无(部分有) 

高频噪声测量

数字存贮示波功能

主干电缆电压测量

高级软件分析和硬拷贝打印输出

±信号错误反接报警

 有

分离型诊断信息总线(任何网段故障不会影响操作

有总线拉出零电流线

无需用电缆或端子盒紧靠终端器或接口

可同时监测所有网段

从现场总线安装直到投运一直留在现场安装点



    4
  现场总线可能发生的故障类型分析

    毫无疑问,一个设计得很好又得到很好维护的现场总线网段,可以运行多年而没有任何问题。但是,就像任何电子系统会在其生命周期内发生某些不可预测的故障一样,现场总线系统仍然会在某些网段的某个点上会发生故障。现场总线的故障可能在任意时间发展或发生而毫无警告。损坏或故障涉及的范围从一个不显著的变化到一个颇为麻烦的报警,或一个致命性的事故。

    为了能充分了解现场总线物理层诊断的具体内容,下面会较详细地讨论在一个广泛的范围内可能发生的故障类型。

    · +/-极对屏蔽的故障(不平衡)  电缆导线的+/-极可能会与屏蔽接触产生一个低电阻,这种故障出现的概率较高,一般都是因为导线的终端与仪表的外壳接触,或是在安装过程中电缆受到损坏。但并不是所有的故障会直接短路或者产生一个低的接触电阻,有时有可能产生一个电容或高接触电阻。电缆的安装走线不良或者电缆的制造缺陷,也有可能导致电缆产生了不可接受的电容不平衡,如果仪表本身也有些不平衡,这就是情况复杂化了,有时还可能电缆受潮或不慎受到水浸,使传导性能变坏。虽然这些问题在一段时间内可以容忍,但由此而导致由一般的小问题发展成为故障,例如产生电容对地短路和一个极直接对屏蔽短路。不平衡往往会使对噪声的灵敏度增加,因而提高了通信出错的几率。

    · +极对-极的故障  这种故障同样也会发生。在主干网电缆中两极之间的短路是不能容忍的,这会导致整个网段出现故障,也有可能并非直接短路,而是呈现一定的电阻,这时仪表的滤波电容或过载保护的半导体器件会发生漏电,电缆或接线盒浸水,也会引起此类故障。

    ·串线、噪声和干扰  噪声会以多种形式出现,且其会覆盖整个频谱。如果靠近变频装置,或电缆自身受到振动,受到电磁干扰,或从邻近的电缆引来串线干扰,都会引发噪声。接地回路和接地耦合噪声会通过电缆的屏蔽传导过来,并对主干电缆和分支电缆产生干扰。事实上,接地故障常常被认为是通信信号最大的问题,是许多祸害问题之源。现场总线标准规定了从DC到几十兆赫兹整个频谱噪声电平的限制,最具破坏力是那些在通信带宽内、且电平超过75mV(峰—峰值)的噪声。

    ·终端器故障  简单的终端器是公共的故障点。即使是有冗余电源的所谓电子终端器,其实总是主干电缆的现场侧的单一终端器。终端器的故障是由于终端器的电阻被击穿至开路而引起终端器不齐作用,或者是电阻值降低造成通信信号的严重畸变。终端器中的电容发生故障的形式有:开路,是终端器失效;短路,导致网段受到致命的冲击或元器件损坏;电容值向低漂移;电容损坏呈电阻性或彼岸变成导体,以致终端器逐渐失效。

    ·终端过载/欠载  现场总线系统可以在一定程度上容忍终端的过载或欠载,这与网络的配置和起始发出的信号质量有关。现场总线的电源/电源调理器,以及设备的负载也会对此有所影响。在长主干电缆的终点一旦发生终端器失效或为接入终端器,就会使通信信号产生反射,致使信号畸变。

    ·现场总线电源漂移或阻抗故障  现场总线电源的无源阻抗是固定不变的,而其有源阻抗则取决于电容和晶体管,当将两个现场总线电源配成互为冗余时,这些元器件会随时间产生漂移或损坏。有源现场总线电源的阻抗发生漂移或失效,并不一定导致信号衰减,倒是常常会使信号的顶部由平变陡,如果电容过大,会使波形的上升沿呈两段上升折线;如果电感过大,会使波形的下降沿沿呈两段下降折线。信号的这些畸变首先会导致“抖动”不稳定出错,接下去在产生致命性故障前会引起多次的数据重发。

    ·水浸入  现场发生重大故障、接线盒密封失效或者电缆断裂、折损或渗水,致使通信电缆浸泡在水中,或接线端子排浸在水里,这时会造成绝缘受损、导电性显著增加,或主干电缆的电流改变、对地泄露,但一般不会引起噪声。绝缘受损使得端子之间有导电现象产生,从而发生电蚀,随着时间推移电缆也会受到电蚀。

    ·现场总线设备故障  许多现场设备内设有故障切断电路,就是说当它检测到破坏性的“信号”会立即自动将设备从网段中断开。不过不是所有的问题都可以得到保护,因为在网段或分支电路上的保护器能有效动作之前有一段时间,设备的阻抗就可能发生漂移至产生破坏性的程度。为使设备能与主干电缆双向连接,有些设备设有二极管桥路。桥路有可能损坏使阻抗变低,或者发生短路故障。

    ·瞬间电压抑制二极管(TVS)和电涌放电器  为防止电压瞬间过载损坏分支保护器和设备中的敏感电子元器件,一般总会在现场总线电源中设有TSV或电涌放电器。虽然他们能起到保护作用,但事实上它们自身又成了一个公共故障点。TVS是直接扣压接在主干电缆,其性能的漂移或漏电、甚至可能短路,都有可能造成这些设备共有的损坏方式。在正常运行期间,TVS有可能在没有电应力和热应力的情况下失效,形成一个不确定的故障因素。尤其是在受到一次高电压的浪涌其性能变差,结果导致漏电或阻抗发生有问题的改变。

    ·现场总线噪声滤波电容器问题  现场设备、现场总线电源和保护电路通常都用一个小电容跨接在±极与屏蔽之间,起到噪声滤波的作用。在一个网段中要介入好多个设备,例如接12个设备,就会接上36个电容器,故障的可能性就会大为增加。因为电容器可能开路、短路或者向低电容值漂移,结果会造成不同的作用,某些情况下可能是破坏性的,或者由于没有引起注意导致酿成复合型的故障。

    ·信号极性接反  许多设备是双极性的,这就是说有可能以任意极性与网段相连。然而有些设备如电源或中继器是非双极性的,这样就有可能发生意外的极性接反问题。这使数据信号反转,在某些时候系统容忍这种反接,不过设备之间的通信就会出问题。如果在安装和调试投运期间极性接反了,直到正式投产,有可能好多问题还难以发现。

   ·现场总线供电电源的状态正常监测和故障  现场总线电源的输出电压可能会在用了很长时间后超出了容许范围。即使有采用冗余电源,由于或门二极管短路,或者有一个电源的内阻变低而使输出变低了等原因,致使两个电源中的任一个发生故障,都应采取紧急措施加以更换。

    5
  故障检测的高级测量技术

    要采用一定的测量技术才有可能在实际现场总线系统的运行过程中及时检测出潜在故障的所在,并判别出其类型,进行早期的预警。

    实际上,可以把上述故障类型检测加以一定的分类,例如DC性质的故障检测、AC性质的故障检测、信号电平衰减的故障检测、屏蔽对±极的AC和DC的故障检测、噪声及其干扰的故障检测、电源的故障检测和信号极性反接的检测等等。

    以“DC性质的故障检测”为例,因为不论是现场设备噪声滤波器和二极管桥的DC泄露、TVC的DC泄露、设备电压改变的原因推断、浸水、终端器的DC故障、设备的电流故障,以及±极之间的DC故障,所有这些可能的问题都可以通过主干电缆中流过的电流的微小变化和随着时间而发生增量型的变化加以检测。相对于信号电平的变化来说,主干网的电流变化的检测能够更灵敏的反映问题,具有较好的可检测性。尤其是对于还在逐渐变坏着的±极受到水浸故障的早期预警、终端器中电容的漏电、设备滤波器电容或二极管桥的漏电、保护二极管(TVS)的漏电和设备电流故障或漂移,用主干电缆的电流变化来检测问题更为有效。

    再如属于“AC性质的故障检测”的有TVS和现场设备阻抗变化、有源电源故障或阻抗故障、终端过载或欠载、±极之间的AC故障等,抖动测量显然是用于任意传送中的AC故障检测最重要的测量方法。因为抖动测量忽略特定的或分立的故障如噪声电平或信号衰减,而集中于检测通信数据的精确度,看数据的传输是否足够的好。它可检测由于网络阻抗变化、信号畸变、网络谐振、有源现场总线电源阻抗漂移、终端器电容或电阻漂移、设备滤波器电容漂移、设备阻抗故障和全带宽噪声的影响等所造成的信号幅度的变化。噪声影响或信号衰减/畸变有时单独尚满足所求的规范的限制,不过合在一起便会产生故障。如果数据信号存在向故障变化的趋势,用较长的时间进行抖动测量,就可以在发生数据传输遭遇破坏前发现问题信号电平测量可以用来检测由于集中有源电源阻抗故障或漂移、电缆衰减、终端过载/欠载或者设备阻抗故障所造成衰减。现场总线可以在信号电平很低的情况下运行,但可能造成数据丢失,所以在信号变得低于可接受的电平之前就应发出预警。将抖动测量与信号电平测量组合使用,使我们可以更好地实现有目标的故障诊断。

    并不是所有的“屏蔽对±极的AC和DC故障”都是简单的短路,可以将它们视为不同程度的电容性和电阻性故障,由此来评定是哪个极出现问题。电容性的故障或不平衡可能是由于现场仪表中的解耦电容器损坏,或者是由于制造中的缺陷致使电缆异常的不平衡,还有可能是安装问题。此外,浸水和现场设备噪声滤波器的电容漂移等,常常是通过电容检测、电阻测量来发现问题。对于那些正在因浸水而缓慢发展的±极对屏蔽的可能故障,用这种测量发出早期预警是很有效的。

    至于串线干扰、噪声干扰和电磁干扰,可以用频带内有害噪声检测,以及全频谱分析予以检测,对于源于终端器故障、现场总线电源阻抗故障、接地故障、串线、驱动电机等引起的低频噪声,更容易用全频谱分析方法测量。

    综上所述可以知道,现场总线的物理层故障检测是需要用很多测量方法来辅助检测、判断和评估的。而要把这些方法综合在一个故障诊断系统内,除了用连接在现场总线主干电缆上的故障诊断模块或诊断适配器来采集相关的信号和信息而外,很重要的是有一套运行于计算机中、集合网络分析器(检查通信协议运行质量)、示波器(通过网络运行时测试数字通信的波形检查信号质量,其中包括信号幅度、反射、噪声、EMC等在内)和生成网络故障分析报告诸功能的软件。如果这个诊断系统是专为Profibus-DP设计的,那么它还必须是Profibus-DP的主站,具备主站所必需的诸如网络组态、I/O测试、网络扫描及动态清单,以及设置从站地址等功能。否则就不能进行现场总线运行时的在线诊断了。

    目前能对Profibus-DP总线运行状态进行动态检测、分析和故障诊断,有多家公司的产品,如荷兰PROCENTEC公司的ProfiTrace2(它包括多个部件,有ProfiCore适配器、进行动态检测和分析的ProfiTrace、测试通信电缆的质量、终端电阻的质量、电缆短路、接线断开、衰减情况和电缆线接反的ProfiPulse等);德国Softing公司的PB-T3型分析仪;德国ITM/ComSoft公司的IT-Monitor等。

    参 考 文 献

    [1]Gunther Rogoll.Ren Kitchener,Advanced Online Physical Layer Diagnostics.P+F White Paper.

    [2]A Wireless Way to Unleash the Power of HART Data.Airsprite White Paper. www.airsprite.com.

    [3]Self-monitoring and Diagnosis of Field Devices.NAMUR NE 107.


                                                                ——转自《自动化博览》