企业简介

作为中国自动化领域的权威旗舰网络媒体,控制网创立于1999年7月,是中国举行的第十四届IFAC (International Federation of Automatic Control)大会的中国官方组织机构的唯一指定网站。控制网是中国自动化学会专家咨询工作 委员会(ECC)的秘书处常设之地。是北京自控在线文化传播有限公司开设的网站。

  • 公司类型:其他

联系方式
  • 控制网
  • 地址:北京市海淀区上地十街辉煌国际2号楼1504室
  • 邮编:100085
  • 电话:010-57116291 / 59813326
  • 传真:010-59813329
  • 网址:http://www.kongzhi.net
  • Email:mahongliang@kongzhi.net
  • 联系人:市场部
案例详细
标题基于回归支持向量机的软测量建模研究
技术领域
行业
简介软测量技术是解决现代复杂工业过程中较难甚至无法由硬件在线测量参数的实时估计问题的有效手段。本文介绍了基于回归支持向量机(SVR)算法的基本原理,并以非线性、时变、大滞后的PTA氧化过程为研究对象,使用SVR算法对4-CBA含量进行了预测。结果表明,与传统预测方法相比,采用SVR算法的预测模型,具有精确度高,泛化能力强等优点,是用于PTA氧化过程中4-CBA含量预测的一种有效的方法,具有很好的应用价值。
内容

                         
    邵联合(1974-)男,黑龙江虎林人,工学硕士,大学讲师,现就职于保定电力职业技术学院,主要研究方向为生产过程自动化及仪器仪表。

    摘要:软测量技术是解决现代复杂工业过程中较难甚至无法由硬件在线测量参数的实时估计问题的有效手段。本文介绍了基于回归支持向量机(SVR)算法的基本原理,并以非线性、时变、大滞后的PTA氧化过程为研究对象,使用SVR算法对4-CBA含量进行了预测。结果表明,与传统预测方法相比,采用SVR算法的预测模型,具有精确度高,泛化能力强等优点,是用于PTA氧化过程中4-CBA含量预测的一种有效的方法,具有很好的应用价值。

    关键词:软测量;数学模型;4-CBA;回归支持向量机

    Abstract: In the modern complex industrial processes, some variables are very hard to be measured or even cannot be measured on-line by existing instruments and sensors. Soft-sensing technology can effectively solve the problem of realtime estimation. The basic principle of Support Vector Regression Machine (SVR) algorithm was introduced in this paper. For the process of PTA oxidation with non-linear, time-varying, large time delay characteristics, the 4-CBA Content was predicted by SVR. The predicted result was compared with that of traditional forecasting methods. The comparison result shows that the SVR has better integrative performance, high precision and generalization ability,so it is an effective method for being used in forecasting of 4-CBA content of PTA oxidation process and has a very good application value.

    Key words: Soft-sensing; Mathematical model; 4-CBA; Support Vector Regression Machine

    1 引言

    建立在统计学习理论基础上的支持向量机 (support vector machine,SVM)[1-3]已成为当前机器学习领域的一个研究热点。

    支持向量机采用结构风险最小化准则,在有限样本情况下,得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值,解决了一般学习方法难以解决的问题,如神经网络的局部最小问题、过学习以及结构和类型的选择过分依赖于经验等固有的缺陷等问题,从而提高了模型的泛化能力。另外支持向量机把机器学习问题归结为一个二次规划问题,因而得到的最优解不仅是全局最优解,而且具有唯一性。SVM的方法最早是针对模式识别问题提出的,Vapnik通过引入ε不敏感损失函数,将其推广应用到非线性回归估计中,得到了用于回归估计的标准SVM方法,称为回归支持向量机(support vector regressor,SVR) [4,5]算法。

    2 支持向量机回归算法原理

    SVR算法的基础主要是ε不敏感函数(ε-insensitive function)和核函数算法[6]。若将拟合的数学模型表达为多维空间的某一曲线,则根据ε不敏感函数所得的结果就是包络该曲线和训练点的“ε管道”。在所有样本点中,只有分布在“管壁”上的那一部分样本点决定管道的位置。这一部分训练样本称为“支持向量”(support vectors)。为适应训练样本集的非线性,传统的拟合方法通常是在线性方程后面加高阶项。此法诚然有效,但由此增加的可调参数未免增加了过拟合的风险。SVR采用核函数解决这一矛盾。用核函数代替线性方程中的线性项可以使原来的线性算法“非线性化”,即能作非线性回归。与此同时,引进核函数达到了“升维”的目的,而增加的可调参数却很少,于是过拟合仍能控制。

    2.1 线性回归情形

    设样本集为: ,回归函数用下列线性方程:
    

    最佳回归函数通过求以下函数的最小极值得出,

   (1)

    其中C是设定的惩罚因子值,ξ、ξ*为松弛变量的上限与下限。

    Vapnik提出运用下列不敏感损耗函数:

    (2)

    通过下面的优化方程:

    (3)

    在下列约束条件下:

    
    求解:

    (4)

    由此可得拉格朗日方程的待定系数 和 *,从而得回归系数和常数项:

    (5)

    2.2 非线性回归情形

    类似于分类问题,一个非线性模型通常需要足够的模型数据,与非线性SVC方法相同,一个非线性映射可将数据映射到高维的特征空间中,在其中就可以进行线性回归。运用核函数可以避免模式升维可能产生的“维数灾难”,即通过运用一个非敏感性损耗函数,非线性SVR的解即可通过下面方程求出:

    (6)

    其约束条件为:

    (7)

    由此可得拉格朗日待定系数 和 *,回归函数f(X) 则为:

    (8)

    3 基于回归支持向量机的4-CBA含量的软测量建模

    对二甲苯(Pa r a-Xyl ene,简称PX)是一种重要的化工原料,通常由石脑油经过加工得来,PTA全名精对苯二甲酸(Pure Terephthalic Acid),由PX氧化得到,主要用于生产聚对苯二甲酸乙二醇酯(俗称聚酯),聚对苯二甲酸丙二醇酯以及聚对苯二甲酸丁二醇酯。

    3.1 PX氧化工艺流程

    作为聚酯工业重要原材料的PTA主要由PX氧化而来。其氧化过程流程由图1所示。在氧化反应中,4-CBA浓度是作为氧化反应进程的观测器,其含量是PTA产品中的主要杂质及重要质量指标。根据反应机理研究,4-CBA含量过低,则表明氧化反应程度加深,副反应加剧,能耗及醋酸、PX单耗增加。而浓度过高则表明氧化反应停留时间较少,氧化反应不足,将导致PX转化率过低,这是生产过程主要必须控制和克服的。因此为了节能降耗,并保证PTA的产品纯度,一般工业要求其含量在TA中为1500~3000 。在工业生产中4-CBA含量往往通过离线光谱分析获得,但离线的分析滞后数小时,且分析采样次数少(一天两三次),远远不能满足控制的要求[7-9]。为了实时预测中间反应物4-CBA含量,需要建立一个能够较精确预测4-CBA浓度的软测量模型[10]。
                   
                                   图1  PX氧化过程流程图

    3.2 软测量模型的建立

    整个PTA氧化单元包括近10个罐,整个流程的停留时间为200min左右,与最终4-CBA浓度对应的过程变量有不同的对应时间间隔。在PTA 生产过程中,DCS 系统每隔半分钟采集一次数据,被采集的过程变量多达上百个,将这些变量全部当作模型的输入变量是不切实际的,一方面会使模型复杂化,另一方面还会降低模型的预测能力,因此在建立软测量模型之前需要选择模型的输入变量。表1给出了软测量模型的输入变量、变量滞后时间以及正常操作值。从实时数据库中采集数据463个样本用于训练。每个样本有10维属性,分别代表在某一时刻工况下的操作参数,样本输出为4-CBA 浓度。

                   
    4 仿真实验

    本文用来估计PX氧化过程模型参数的数据全部来源于工业现场,采集到的463组数据值,以混合罐料流量、催化剂浓度、反应器温度、反应器液位等为输入数据,用支持向量机回归方法为模型。在模型中,核函数选为高斯核,P=0.05,物性常数:C=100,不敏感函数:ε=0.1。图2是PTA样本集从x(0)到x(463)的测试过程。来预测4-CBA含量,其中红线为模型预测值,蓝点为真实值。
                      
                                 图2  基于SVR模型的4-CBA含量的预测
    5 结论

    SVR算法基于结构风险最小化,克服了传统方法的过学习和陷入局部最小的问题,具有很好的回归精度和泛化能力;对于复杂的系统,用支持向量机回归方法来提取特征样本,用这些少量的特征样本来估计机理模型参数,可以减少计算时间,同时避免了人工随机试凑法选择训练样本的盲目性。利用其对PTA氧化过程中4-CBA含量的进行预测,具有更快的收敛速度、更好的拟合精度和良好的预测性能,4-CBA含量软测量的实现为PTA装置的稳定操作和离线指导提供了依据。

    参考文献:

    [1] Vapnik V. The Nature of Statistical Learning Theory[M]. NewYork,Springer,1995.

    [2] 邓乃扬,田英杰. 数据挖掘中的新方法—支持向量机[M]. 北京: 科学出版社,2004.

    [3] CAUWENBERGHS G,POGGIO T. Incremental and Decremental Support Vector Machine[J]. Advances in Neural Information Processing Systems,2001,13: 409-415.

    [4]Vapnik V. The Nature of Statistical Learning Theory[M]. New York: Springer2Verlag,1999,2nd ed.

    [5]Vapnik V. An overview of statistical learning theory[J]. IEEE Transactions on Neural N etworks,1999,10(5): 988-999.

    [6] 荣冈,金晓民,王树青. 先进控制技术及应用: 软测量技术及其应用[J]. 化工自动化及仪表,1999. 26(4): 70-72.

    [7] 俞金寿,刘爱伦,张克进. 软测量技术及其在石油化工中的应用[M], 北京: 化学工业出版社,2000.

    [8] 李修亮,苏宏业,褚健.基于在线聚类的多模型软测量建模方法[J]. 化工学报,2007,58(11): 2834-2839.

    [9] 李海青,黄志尧. 软测量技术原理及应用[M]. 北京: 化学工业出版社,2000.

    [10] 汪永生. 软测量理论、方法、软件包及其工业应用研究[C]. 上海交通大学,2000. 43-48.

    摘自《自动化博览》2010年第三期