资讯详情

关联规则挖掘_状态检测 | 电力变压器故障类型与关键状态量关联规则分析

cf11501f537fad14ce03905a8cba7b79.png

2020年《浙江电力》第一期目录及重点文章

2020年《浙江电力》第二期目录及重点文章

2020年《浙江电力》第三期目录及重点文章

征文 |储能技术规模化应用技术专题征文通知

百度搜索浙江电力,寻找唯一的官方贡献网站:

http://www.zjdl.cbpt.cnki.net/

电力变压器故障类型及关键状态量关联规则分析

董 翔1,赵 戴瑞成1,董小兵2

(1.国网北京电力维修分公司 100069.国网陕西电力有限公司经济技术研究院 710065)

0 引言

随着计算机技术的快速发展,电力变压器的故障检测方法发生了巨大的变化[1-2],并逐渐转向计算机领域。通过建立相应的数学模型来预测变压器的内部故障,使故障检测朝着智能和信息的方向发展[3-4]。

常用的故障检测方法包括基于人工神经网络模型、基于模糊理论和基于专家系统的故障诊断。此外,其他诊断方法,如Petri故障诊断也采用了网络、灰色聚类和支撑向量机,并得到了一定程度的发展。每种方法都有优缺点,人们需要根据实际问题找到最合适的方法。根据当今的发展趋势,人工智能方法在故障诊断领域的地位越来越重要。

传统的设备运行维护基本采用状态维护技术,根据设备的定期试验结果和评价模型制定[1-2]。现阶段随着带电检测、在线监测和运行数据逐步纳入电力企业云平台,为开展电力设备大数据分析、进一步提高供电可靠性奠定了基础。现阶段积累的状态监测检测数据尚未充分挖掘利用,导致信息资源浪费[3-4]。

因此,有必要完成变压器异常事件及其影响因素的研究、收集和相关规则库建设,基于大数据技术和未来短期预测,逐步提高设备故障诊断水平,为后续生产运行和状态评价提供决策依据。本文介绍了相关规则挖掘的基本原理、故障状态量的划分和数据离散处理方法SPSS Modeler 软件平台建立了电力变压器故障相关规则挖掘模型,旨在发现状态特征与故障类别之间的内部联系,并通过相关规则挖掘确定故障。

1 相关规则挖掘基本原理

1.1 挖掘相关规则的概念

关联规则挖掘的概念可描述如下:设置I={i1,i2,…,im}是项目的集合,D={d1,d2,…,dn}是事务数据库,事务都有唯一的标志。每个事物di(i=1,2,…,n)都对应I 上一个子集Ij(j=1,2,…,m),Ij即为由j 项I 元素组成的集合。关联规则是定义的I 和D 满足一定信心和支持的形状Ij→di的关系式。挖掘相关规则的主要任务是挖掘出支持度和信心度分别大于或等于设定的最小支持度和信心度的相关规则。

1.2 挖掘相关规则

1.2.1 挖掘过程的相关规则

挖掘过程如下:

(1)找出所有频繁的项目集。所谓频繁项目集,是指支持度不小于给定最小支持度的项目集,如k 阶频繁项集Lk每个元素都由k项组成,每个元素的支持度不小于最小支持度阈值,为2 以频繁项集为例,其形式是L2={ {i1,i2},{i1,i3},{i2,i4},…}。

(2)根据频繁的项目集生成相关规则。这一步以信心大于或等于用户设定的最小信心为基本原则,生成预期的强相关规则。

在以上2 第(1)步的任务集中了几乎所有的计算量,所以耗时相对较大;第(2)步容易在第(1)步的基础上实现,所以相关规则挖掘算法的性能主要取决于第(1)步。

1.2.2 挖掘算法的相关规则

Apriori 算法作为关联规则挖掘的经典算法,自提出以来一直在关联规则挖掘中占有重要地位。该算法主要包括两个步骤:挖掘频繁的项目集;相关规则由频繁的项目集生成。Apriori算法是一种挖掘频繁项集相关规则的算法,其核心是基于两阶段频集思想的递推算法。该关联规则属于单维、单层和布尔关联规则。如图1所示 所示。

图1 Apriori 算法原理

相关规则挖掘过程的核心部分是频繁项集的生成过程,因为频繁项集的生成过程是影响算法的关键,也是计算量最大、耗时最长的过程。生成频繁项集的过程有2个 个子步骤:

(1)连接步。频繁产生k 项集的集合Lk,首先要找到候选人k 项集的集合Ck,该集合可以通过频繁使用(k-1)项集集合Lk-与自己联系。假设l1和l2均为Lk-1中的项集,lj中的第i 项用lj[i]来表示。假如他们的前面(k-2)如果个项相同,即满足(l1[1]=l2[1]∧l1[2]=l2[2]∧…∧l1[k-2]=l2[k-2]∧l1[k-1]≠l2[k-1])。连接l1,l2产生的结果项集是候选人k 项集:Ck={l1[1],l1[2],…,l1[k-1]l2[k-1]}。

(2)剪枝步骤。因为候选项集并不是所有的项集都很频繁,为了减少搜索空间,可以从Ck中去掉候选k 项集的(k-1)项子集[5-7]。

1.2.3 实现算法程序

根据上述算法原理,可以想象程序的实现应分为以下 个模块:

(1)频繁找出满足最低规则支持的频率n 项集Ln,为此,首先要构建初始候选人1 项集C1及频繁1 项集L1.连接步依次生成Cn,再在Cn中筛选出Ln。

(2)从频繁n 项集Ln中筛选出满足最低支持的中筛选Qn。

(3)在Ln找出满足最低规则支持和最低支持的强规则集。

相关规则挖掘阶段主要由变压器故障数据收集整合、数据预处理、单变量交叉表分析利用四个部分组成Apriori 相关规则[8-10]得到算法。

2 故障状态的划分和数据离散处理

2.1 故障特征量和故障类型划分

在故障状态下,变压器会产生多种气体。PCA(主成分分析)输入参数分析方法优化相关量。利用PCA 选择诊断模型对应的最佳参数,同时消除影响诊断准确性的冗余参数,最后取8个 种气体(CH4,C2H2,C2H4,C2H6,H,CO,CO2、总烃)作为故障特征,即故障诊断中的条件变量,选择过热放电、低温过热、中温过热、高温过热、低能放电和高能放电,并标记相应的变量,如表1、表2 所示。

将故障特征与变压器典型故障相结合,可在相关分析规则分析中形成数据集I,记为:

I={x1,x2,…,x11,y1,y2,…,y6} . (1)

以下电力变压器故障与特征量的关联分析是特征量集X={x1,x2,…,x11}与故障集Y={y1,y2,…,y分析6}的相关性,计算获得X→Y 模糊关系规则。

2.2 数据离散化

原始数据中存在着许多空缺值,并且关联规则挖掘需要针对的是离散化数据,因此原始数据必须进行预处理后方可使用。对于空缺值的处理一般有平均值填充和去2 种方法。由于本文中所处理数据量较大,并且分散性较高,所以当一个案例所有信息均空缺时对空缺值采用去除的方法,若案例的空缺信息不多,则利用Spss Modeler将其设为缺失值。数据的离散化方法有很多,如等距离划分法、等频率划分法、K-means 算法、最小信息熵法、NavieScaler 离散化和模糊离散方法,方法的具体选取由数据本身决定。

表1 变压器故障特征量

表2 变压器典型故障类型

有关故障状态量的离散化本文选取了布尔逻辑算法和模糊离散方法2 种方法,优先运用布尔逻辑算法。由于正常变压器油中氢和烃类气体的含量限值各不相同,具体注意值如表3 所示,若对所有属性值采用相同的区间,则缺乏一定的针对性。且由对电力变压器数据统计特征分析可知,有4 种气体其绝大部分数据均集中在含量极小处,综合考虑后决定离散方法如下:若离散值为0,则表示气体含量在正常范围内;若离散值为1,则表示气体含量超出注意值。

表3 正常变压器油中氢和烃类气体的含量限值

由于国标没有规定CO 和CO2的阈值,因此可利用现有数据的分布来确定二者具体阈值,即根据IEEE 所规定的气体浓度极限值,通常是基于去除了破坏后的样品的大型数据库的90%和95%的气体浓度来确定的。

3 建模分析

基于关联规则挖掘基本原理,利用SPSS Modeler 软件平台建立电力变压器故障关联规则挖掘模型。先以改进的等距离划分算法所得离散化数据的建模过程作为重点介绍。当采用模糊的离散化方法离散时,建模过程与此相同。

其中,将能直观表示故障特征量以及故障类型总共9 个类别量之间相关联程度的网络关系展示如图2 所示。图中,如果案例支持两点之间存在关联,那就在两点之间连成一条线;如果案例不支持,两点之间就不连线。把所有案例遍历后,哪两点之间的连线最多,说明这两点之间的相关性最强。

图2 不同链接数下的属性值相关关系网络图

利用模糊关联规则模型对特高压变压器进行异常状态诊断及分析,流程如图3 所示。以故障特征量为前项,以故障类型为后项,设置最小支持度和最小置信度,运用Apriori 数据挖掘经典算法挖掘出变压器故障和故障状态量之间的关联规则。

4 实例分析

以2016 年某220 kV 变压器跳闸为例进行验证[15]。该变压器跳闸后的试验结果见表4,油色谱数据见表5。

将该结构化数据与故障类型、故障部位进行关联规则匹配,结果见表6。由表6 可知,基于模糊关联规则的变压器诊断结果与实际解体检查结果(B 相低压绕组严重变形,多处匝间短路,存在电弧放电)相符。

图3 模糊关联规则模型诊断分析流程

表4 变压器电气试验结果

表5 变压器故障油色谱数据

表6 诊断结果

5 结语

本文以电力变压器故障特征量为前项,以故障类型为后项,设置最小支持度和最小置信度,运用Apriori 数据挖掘经典算法挖掘出变压器故障和故障状态量之间的关联规则。基于关联规则挖掘基本原理,利用SPSS Modeler 软件平台建立电力变压器故障关联规则挖掘模型进行建模分析,得到以下故障诊断流程:

(1)利用PCA 法对输入特征参量进行优选,得到优选后的特征参量。

(2)基于模糊集合理论对优选后的特征量(油色谱及电气试验数据)进行模糊离散处理,得到相应离散后的特征数据库。

(3)基于离散后的特征数据库,使用Apriori算法进行关联规则的提取。

(4)利用所提取的关联规则对待诊断设备进行故障判定。

该流程能够从历史数据中获取潜在的诊断知识,有效解决故障诊断中知识获取困难的问题。实际应用时,在得到相应特征参量(油色谱数据及电气试验)的数据后,及时转化为结构化数据并对结构化数据进行模糊离散化处理,再将离散数据输入到模糊关联规则模型后即可得到变压器异常状态的诊断及分析情况。

参考文献:(略)

DOI:10.19585/j.zjdl.202002004

开放科学(资源服务)标识码(OSID):

基金项目:国家电网有限公司科技项目(GY71-15-052);国家自然科学基金(50907051)

作者简介:董 翔(1989 ),男,工程师,主要从事电气设备带电检测及在线监测工作。

标签: 用于高能柔性超级电容器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台