运用数据挖掘构建智能电网调度运行分析系统的研究--控制网



运用数据挖掘构建智能电网调度运行分析系统的研究
企业:控制网 日期:2009-11-24
领域:工控机 点击数:2156



作者简介:陈勇(1966-),男,高级工程师,现任东方电子股份有限公司董事、副总经理,多年从事电力调度自动化、变电站自动化、配电自动化相关领域研究和企业管理工作。

    摘  要:本文依据电力调度实际运行情况和业务知识需求,考虑智能电网发展趋势,提出了利用数据挖掘技术建设智能电网调度运行分析系统的解决方案,讨论了调度运行业务分析系统的体系结构和数据挖掘模型,并说明了调度运行业务信息分析实例和系统实现技术。

    关键词:数据挖掘;智能电网;调度运行;业务分析;综合信息平台

   Abstract: Based on data mining and business information request in electric power dispatching,considering the development trend of Smart Grid,this paper presents one solution of building the intelligent operation analysis system by using data-mining technology.We discuss the system architecture,and data mining model,and present.the instance of dispatching operation business analysis and the technologies of system implementation.

   Key words:Data Mining;Smart Grid;Electric Dispatching Operation;Business Analysis;Integration Information Platform

    智能电网是当今世界电力自动化系统发展的最新动向,被认为是21世纪电力系统的重大科技创新和发展趋势。作为下一代电网自动化、信息化解决方案,智能电网是电网运行和管理的“中枢神经系统”。可综合处理各类调度自动化数据信息,为调度员提供各种智能分析和辅助决策工具,具有高度开放性、可用性和信息安全性,可适应各种标准信息集成框架的调度自动化系统[7-9]

    本文针对我国智能电网的建设背景,探讨构建智能电网的技术研究。结合电网调度业务需求,提出了利用数据挖掘技术构建应用系统的解决方案,按照“集成信息——构建模型——提取知识”的业务分析思路,建设智能电网调度运行分析系统,实现消除信息孤岛,形成信息共享,支持智能化业务知识分析。

    1  系统体系结构

    智能电网调度运行分析系统综合数据报表、数据挖掘和多维分析等商务智能技术,从历史数据中提取信息,分析对调度决策有价值的知识。系统体系分为三层:信息集成层整合各种业务系统的结构化和非结构化数据,构建综合信息平台;应用服务层整合业务模块,根据粒度大小整合业务服务对象,实现基于数据挖掘模型的知识发现,并通过消息通讯和工作流技术进行业务衔接,跨越多个应用进行业务流程整合;展现层主要实现系统访问层次上的整合,向用户提供统一的交互模式。系统体系结构如图1所示。

           

                                   图1  系统体系结构

    电力企业目前已积累了许多有关调度运行和管理的数据,这些数据处于SCADA、EMS、TMR和GIS等系统中。由于这些数据的分散性、异构性,再加上安全分区、横向隔离的要求,使得很难直接获取这些系统的数据并基于这些数据发现隐藏在海量数据背后的信息或知识。为了发现这种信息或知识,首先需要对数据进行整合,对这些分散的数据进行抽取、转换、加载和清洗,然后基于该数据信息平台进行相关主题的数据挖掘以获取所需要的知识。

   业务整合是将原有的分散于企业内部或外部的“业务流程断点”进行链接,完成业务活动自动化的过程,利用工作流、消息、协同等技术,实现跨系统整合,使跨部门业务能够在网络环境中实现对同一事务的协同处理。降低服务对系统交互的信赖性。服务之间通过简单、精确定义的接口进行通信,实现各系统间业务流程整合和管理。

    展现层实现信息系统用户交互层次的整合,访问企业内分布存储的、各种来源的信息内容,并提供统一的检索和内容访问控制。内部用户可通过Intranet根据系统赋予的不同权限实现各个业务应用访问的集成,提供集成化的服务,实现信息查询和报表展示。

    2  数据挖掘模型

    数据挖掘就是从海量数据中挖掘出有价值信息的技术,应用一系列技术从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、有用的信息和知识的过程[1-5]。其工作过程包括数据整合、建立模型、挖掘和知识分析。数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形、图像数据,甚至是分布在电力调度各类业务间的异构型数据。

    数据挖掘技术在处理电力调度海量数据和挖掘深层次信息方面有着很大的优势,针对电力调度业务需求,可以采用数据挖掘中发现知识的预测模型、多维分析模型、关联分析模型等方法构建挖掘模型,实现知识提取。

    2.1  预测模型

    为了把握分析对象发展规律,需要用已有数据序列预测未来趋势。电力负荷预测是调度业务中常用技术,在充分考虑系统运行特性、增容决策、自然环境和社会影响的条件下,研究或利用一套能系统地处理过去与未来负荷的数学方法,根据气温、湿度等因素预测未来用电需求,在满足一定精度要求的前提下,确定某特定时刻的负荷数值,指导电力调度决策。

    负荷预测比较常用的方法有:时间序列法、灰色预测法、模糊聚类识别预测法、神经网络预测法和优选组合预测法等。人工神经网络能够建立任意非线性的模型,适用于解决时间序列预测问题。时间序列模型强调考虑时间特性,尤其是考虑时间周期的层次,如日、星期、月等,还可考虑日历的影响,如节假日等,适合应用于电力系统的负荷预测。

     2.2  多维分析模型

    维是信息所对应的层次概念,多维分析以维为基础,将数据分类进行抽象统计分析,按照分析对象的属性、特征,建立业务信息分类模型。多维分析基于统计学原理,在不同维度之间关联后做数据分析,在电力调度分析中通常按时间(年、季度、月、周、日)和区域(地区、省、城市、区)进行分析,常用的方法有回归分析、方差分析等。

    电力调度业务数据也可以采用分类模式进行统计分析,将数据分为三类进行归纳,提取能代表共同特性的信息:①设备台账类,描述电力调度对象固有属性的数据,包括一次设备、二次设备、自动化设备、通信设备等,主要来自业务系统的设备数据库,包括各种参数、定值;②动作记录类,电力调度所从事的工作,实质上就是对电网设备的操作,以及处理电网设备的动作,这类数据来自日志(调度、保护、自动化、通信)、操作票、工作票,开关变位、保护故障信息系统等,反映电力系统运行的非连续过程;③时间采样类,反映电力系统连续变动过程的一系列数据,其最大特点就是时间性,根据应用目的不同设置不同的粒度,如来自SCADA/EMS的原始数据可达到秒级的时间间隔,有分钟级或小时级的采集电量,还有按日、旬、月、季、年汇总加工的报表数据等。

    2.3  关联分析模型

    关联规则反映事物之间依赖或关联的知识,关联规则挖掘是在数据库或信息知识库的项目集或者对象集中寻找关联、相关、或有因果关系的信息,涉及的两个重要参数是最小支持度和最小信任度,支持度表示规则前件和后件同时在数据集中出现的概率;信任度表示在规则前件成立时能够推出规则后件的概率,或者说规则后件相对于规则前件的可信程度。相关性指某种事物发生时其他事物会发生的一种联系,可以通过关联的支持度和可信度来描述。

    进行电力负荷特性分析时,可以将影响负荷特性变化的因素分为两类:一类是对负荷具有长期影响效应的因素,对负荷的影响表现为负荷变化的长期趋势性,例如经济发展、产业结构变化等;另一类是对负荷的影响具有短期效应的影响因素,比如温度、降雨量等气候因素。研究各种相关因素对各行业或区域用电负荷变化的影响规律,有助于提高电力负荷的预测精度,确保电力系统的安全、经济运行。

    本系统在具体应用中改进ID3算法,不仅考虑决策属性带来的信息增益,还考虑到选择该属性后继续选择的属性所带来的信息增益,即同时考虑树的两层结点,构造出高质量的决策树。运用该算法,能够减少结点数目,使树的深度更小,提高挖掘速度和效率。具体算法为:设A为侯选的属性,A有n项属性值,对应的概率分别为P1,P2,…,Pn,按照最小信息熵原理对属性A扩展,{B1,B2,…,Bn}为n个子结点选择的属性,分别对应的信息熵为H(B1),H(B2),…,H(Bn),则
       
                               (1)

    算法选择属性A*的标准是A*使得H*(A)最小。算法的详细步骤如下:

    (a)对任意未选择的属性A,假设A有n个属性值,对应的概率分别为P1,P2,…,Pn,以属性A扩展,生成n个子结点{B1,B2,…,Bn},Bi是属性A取第i个值时,按照最小信息熵原理选择的A的后继属性,分别对应的信息熵为H(B1),H(B2),…,H(Bn);

    (b)根据公式(1),计算H*(A);

    (c)选择A*使得H*(A)最小,将A*作为新选的属性;

    (d)利用步骤(a)的计算结果,建立结点A*的后继结点{B1,B2,…,Bn};

    (e)对所有的Bi,若为叶结点,则停止扩展此结点,否则递归执行(a)-(e)的过程。

    电力负荷具有随机性,在实际预测中不可能考虑到所有的因素,一方面是由于历史数据的收集和观测困难;另一方面是因为因素太多不仅会引起建模困难,而且会带来运算复杂和数值不稳定等问题。因此选取对负荷预测有较大影响的星期因素和温度、湿度等气象信息作为主要考虑因素,改进决策树预测模型,克服算法的计算依赖于属性值较多的属性、属性间相关性强度不够及对噪声较为敏感的缺点,具有较好的预测结果,在一定程度上揭示影响日特征负荷的各个影响因素的重要程度。

    3  业务信息分析

    为了电力安全经济调度,必须认真分析所有收集到的数据,将其转化为直观、易懂的调度经验知识。为此,基于数据挖掘的调度运行知识获取模型,观测分析结果、提供可视化程度高,便于调度运行人员获得有价值的信息,快速、有效地支持实际调度业务分析。

    3.1  电网运行信息分析

    分析挖掘电网运行的宏观信息,支持电网运行调度知识的发现,根据分析信息合理安排未来的输电计划,充分发挥其跨区输电的潜力,能最大限度满足当前电力需求。建立用电区域、电压等级、用电负荷三维的电网运行数据透视和分析模型,可以直观分析出某区域、某条线路负荷明显高于其他线路的负荷情况,根据分析结果,可进行编制初步的电力调度计划。
业务分析过程中,可以利用多种复杂检索对数据源各特征的总体均值、方差、标准差、中心矩、总体偏度、总体峰度进行计算,提取电网运行信息。按照故障类型、故障发生时间、严重程度和系统的运行模式、人员素质进行相关性分析,从而挖掘出更多的调度运行经验,指导实际调度运行业务。

    3.2  区域负荷趋势分析

    电力负荷具有经常变化的特点,不但按小时变、按日变,而且按周变,按年变,同时负荷又是以天为单位不断起伏的,具有较大的周期性。负荷变化是连续的过程,一般不会出现大的跃变,但电力负荷对季节、温度、天气等是敏感的,不同的季节,不同地区的气候,以及温度的变化都会对负荷造成明显的影响。

              
 
                           图2  本年与上年区域负荷趋势对比

    为了选择适当的电网供电机组类型和合理的电源结构,还必须预测负荷及电量。负荷预测根据目的的不同可以分为超短期、短期、中期和长期。电力系统负荷预测包括最大负荷功率、负荷电量及负荷曲线的预测。最大负荷功率预测对于确定电力系统发电设备及输变电设备的容量非常重要。如图2所示,建立分区负荷趋势对比分析图表,挖掘电网负荷的变化趋势规律,用于指导电网供电负荷调度。

    3.3  电力负荷特性分析

    电力优化调度的目标之一就是要努力减少用户在电网峰荷时段的电力需求,使用户更有效地利用能源,在满足同样能源服务的同时减少其用电量。目前重点实施的削峰填谷等措施在一定程度上改变了负荷曲线的形状,基于用户用电特性的分类方法,通过用户曲线与系统曲线的对比,为电力调度选择用户、采取各种价格措施(如峰谷分时电价、可中断电价、避峰电价等)影响用户用电行为、改善系统负荷曲线形状提供有益参考,促进电力系统的生产和运行效率的提高。

    基于负荷量的用户分类是分析用电特性的基础,建立各类用电特性分析,能直观表明某供电区域商业用电和生活用电为调峰重点,可以加强电力需求侧管理,运用各种措施减少该时间段这两类电量消耗,降低电网最大负荷。

    4  系统实现技术

    4.1  基于综合信息平台实现信息集成

    综合信息平台是建设调度业务分析系统的基础,实现数据整合和集成业务信息,以企业应用集成总线ESB方式提供数据模型,而无需进行点对点转换;基于公共模式的集成数据模型有助于减少数据重复,而且企业范围内参与集成运行的应用可以同时知道数据变化[6]。平台提供灵活的模式定义工具,用户可自定义一些特殊数据模式。分布式计算环境下的多层客户/服务器模式、跨平台、跨网络透明通信框架的特点,实现了电力企业应用以软插件形式插入软总线实现集成运行。

    综合信息平台不同于所谓的“数据平台”,数据平台重点在于采用统一的方法进行数据的存储管理,能提供规范的数据接口,简单的查询统计工具。而综合信息平台的建立,除了要包含数据平台的功能外,还要做到数据信息上的整合。从整体综合规划数据信息,结合业务需求,使用面向服务的方法建立信息模型、业务知识模型和服务模型,把数据和应用结合到一起,方便地解决信息的交流问题,完成信息发布、全文搜索、知识抽取和应用集成。

    4.2  构件模型库

    构件模型库的建设思路就是利用构件技术,在标准的、异构系统互联的中间件技术支持的基础上实现基于软件总线的信息集成,提高应用系统开发效率和运行性能,使应用系统各业务模块凝成为有机体。基于构件耦合法分层设计构件模型库可以充分考虑构件的易扩展性和重用性,减轻系统开发工作量并提高应用质量。根据构件在应用中功能层次的差异,部署在构件模型库中的构件可分为:支撑构件、内核构件、外壳构件等。

    支撑构件层提供系统运行时服务的底层定义和实现,为系统其他构件提供底层支撑。如数据提取构件、数据转换构件、数据通讯构件等。内核构件层实现系统的基本功能,是系统必不可少的组成部分,主要包括两部分构件:一是事务处理构件、安全定义构件、消息处理构件、协调构件等;二是业务建模、计算处理、数据挖掘算法构件等。外壳构件层主要用于与用户的交互功能及业务逻辑的实现。包括界面操作构件、业务逻辑构件、报表生成构件、交互信息处理构件等。

    相对于外壳构件层的用户个性要求经常变化,支撑构件层与内核构件层因系统的需求信息差异而改变的频率很小,从而可以充分利用构件的可重用性,提高系统可靠性和运行性能。

    4.3  动态报表和图形分析

    为增强应用效果,系统将动态业务报表和图形分析技术相结合,提供包括棒图、饼图、折线图等各种图表,使数据统计分析信息以美观、直观的方式展示,提高系统应用水平。系统提供的动态报表可以满足用户复杂Web报表需求,轻松实现企业分散数据信息集成,以个性化的Web报表进行展现,方便用户和业务人员进行查询、统计与分析。进行业务分析过程中,将电力负荷、预测负荷和历史平均负荷以多条曲线同画面显示,能直观地分析偏差走势,支持调度决策。

    5  结语

    本文讨论构建的智能电网调度运行分析系统能够满足电力企业运营模式和调度自动化业务功能需求,适合调度人员进行业务分析,提取调度运行知识信息。数据挖掘是一个人机交互、多次反复的过程,应用中尚面临超大数据量的挑战,如何正确处理冗余信息和噪声数据、提升挖掘结果的有效性和知识信息的实用性是系统建设需不断完善的要素。

    参 考 文 献

    [1]李雄飞,李军.数据挖掘与知识发现[M].高等教育出版社,2003.
 
    [2]刘宇.基于数据仓库和数据挖掘的电力调度辅助决策[D].华北电力大学,2004.

    [3]陈星莺,张晓花,矍峰,等.数据挖掘在电力系统中的应用综述[J].电力科学与技术学报,2007,3:51-56.

    [4]肖峻,张晶,朱涛,等.基于关联分析的城市用电负荷研究[J].电力系统自动化,2007,31(17):103-107.

    [5]仲伟宽.模糊聚类方法在用户负荷曲线分析中的应用[J].华东电力,2007,35(8):97-99.

    [6]李胜利,任军,伊建伟.电力市场中发电厂调度综合信息平台的设计与实现[J].电力设备,2007,8(10):27-29.

    [7]周欢,黄春毅.企业数据总线在管理型商业智能系统中的应用[J].内蒙古科技与经济,2008,23:72-73.

    [8]周瑾,黄立平.知识管理和商务智能关系研究[J].科学学与科学技术管理,2009,3:100-104.

    [9]肖世杰.构建中国智能电网技术思考[J].电力系统自动化,2009,33(9):1-4.


                                                     ——转自《自动化博览》

  • 在线反馈
1.我有以下需求:



2.详细的需求:
姓名:
单位:
电话:
邮件: