世界上所有的坚持都是因为热爱

使用SCADA数据来优化风机运维

Blog cherry


翻译:@风电服务中心

编辑:cherry

0. 概要

 

状态监测系统(CMS)一般是用在风机上安装专用的硬件以及传感器,通过对采集的数据进行分析,进而评估风机部件的健康情况,以及决定是否要采取进一步的维护措施。但是通常情况下,这需要业主进行新的投资。

 

实际上风机的SCADA系统已经包含了很多有价值的信息,可以很有效的用来做风机的健康监测。除了可以用来做现有的故障诊断以外,SCADA数据还可以用来对风机做故障预判,以及寿命计算。这种方法成功的关键在于一个有效的物理故障模型以及一个机器学习系统。

 

为了能够使这样的技术应用在大量的风机上,数据采集、传输、存储以及分析等工作必须要尽可能的自动化,因此我们需要一套专业的软件系统来处理具体的任务。

 

通过统计方法以及物理模型的结合,以及定制化的软件工具,我们就可以在出现影响风机性能的故障出现前得到预警,并且据此采取进一步的运维手段,诸如准备备件,安排合适的检修时间等,以使效益与成本之间达到最优。

 

1、引子

随着风机单机容量越来越大,技术越来越复杂,对于风电投资商来说,更高的质量和可靠性变得越来越重要,如何减少停机时间和运维成本是投资商利润最大化的重要手段。

尤其是随着离岸风电场的开发,其运维成本变得更加的高,因此一个能够优化并有效的风机故障预判解决方案就变得越来越有需求。

 

然而一个有效的运维策略是相当复杂的,要综合考虑诸如人力、资源计划、备品备件、工器具、以及在停机时间以及维护成本之间的权衡。与其他产业相比,风电还要面临地理位置分散,尤其是离岸风场多变的天气状况变成了重要的运维计划要考虑的因素之一。

 

 

2、基于状态监测的运维策略

随着状态监测系统(CMS)逐渐成为基于状态监测的运维策略(CBM)的有效应用,这些不确定的运维计划得到了有效的减少。近些年来,这样的CMS系统已经证明了在检测多种风机故障特别是传动链系统方面有很好的效果,例如轴承、主轴、齿轮等都可以通过振动的监测或者通过对油里面的金属屑的监测。如此这样的预警,可以让运行人员计划进一步检修,并准备可能发生停机时的备件,这对于运维策略的优化提供非常有价值的输入。

然而,实际上这种CMS是有局限性的。购买和安装定制化的硬件,例如传感器,线缆,数据处理单元,存储等,其成本是非常高的,一般在整个风机成本的1-2%左右。即使按照一套非常全面的监测系统,也只有一部分潜在的故障能被检测到。经验表明故障的总类是非常多的,而且分布跨越在多个系统和部件之间。例如变浆系统、偏航系统、控制系统,电力电子、叶片、冷却系统等。特别对于离岸风场,一个小故障可能导致几周的损失,由于天气情况妨碍了及时的维修。

相比于当前主要集中于少量的机械故障,大量可能的故障需要一个相对综合的监测方法。理想情况下,应该能够监测风机的所有主要系统,并能检测到相关的故障。而实现这样的目标不用加装大量价值不菲且只能监测有限故障的传感器,而且从这套监控系统所需要的数据不至于大到在采集、传输以及存储过程中有困难,同时其所有的数据验证、集合和分析等都应该是尽可能的自动化操作的。

 

3、利用SCADA系统数据做状态监测

所有的现代风机都已经装载了大量的传感器用语风机控制以及安全系统。这些构成了SCADA系统的基础。测量数据与风机控制器之间以相当高的频率通讯。尽管这种高分辨率的数据很少存储下来,但是生成并存储10分钟数据已经成为标准,一般包含周期内平均值,也会包含最大值、最小值以及标准方差等。

 

因此,SCADA的历史数据是随时可用的,不需要额外的设备,并且包含了大量的系统行为的信息。这些数据能够有效的用来评估和进行状态监测。这种应用自动监测算法来评估性能的方法已经在过去几十年里应用在像汽轮机以及飞机引擎等方面。虽然方法各异,但是一般都包括数据验证、信号处理、特征提取、建模以及通过统计技术来识别异常的系统行为以进行故障诊断。下面我们将介绍这些技术在风力发电机组上的应用。

SCADA数据已经被证明可以为故障预判以及剩余寿命计算提供所需的信息。这个方法是基于对那些造成系统停机的各种根本原因的故障模型的完整定义,以及为了能够量化负荷和损害累积之间的关系所使用的故障物理学方法而应用的模型,最后,为了给出关于故障的可能性,还要应用统计学方法。故障物理学方法和我们前面提到的故障检测技术一起为我们提供一个完整的故障诊断和预判解决方案。

 

应用SCADA数据也有一定的局限性。根据奈奎斯特定理(又称采样定理),一个信号要想能够获得其全部信息,其采样频率必须至少是最高信号频率的2倍。由于风速波动的本性,很多SCADA的通道,诸如湍流、方向等,都是带有相对高频的动态性,变浆动作一般都会持续几秒,风速、有功功率、电流以及转子转速的变化都可能在几秒和几分钟的周期里发生,在这种情况下,10分钟的平均数据减少了信息的内容,一些临界信号特征也可能丢失了。

                             

根据故障物理学方法,故障模型的定义必须要谨慎,损伤动力与负荷之间是非线性的。例如高周期疲劳,热老化,热机械疲劳等,在这些情况下,10分钟数据所丢失的一些信息,如冲击负荷(例如紧急停机所产生的),根据其实际的损害贡献程度将不会被考虑,导致在计算故障可能性以及剩余寿命的不准确。

4. 可应用的解决方案概述

接下来,我们将介绍一种把传统的故障诊断和预判技术作为其中一部分的风机监测完整解决方案。重点描述其整个过程,如下图:

最初,执行故障模型评估是为了识别重大的根本故障原因以及他们和有效的负荷数据之间的关系。数据被采集并存储在中央服务器,为了能够自动的从地理位置分散,且技术架构多样的风场服务器上采集数据,一般需要定期执行以及进行集成的服务。

通常数据会从多种风机类型采集,可能会来自于多家制造商的不同型号以及不同运行时间的风机。因此,首要的挑战就是为了获得统一的数据格式而进行的数据规范化。数据开始存储于一个称之为“暂存区”的独立数据库中,然后通过数据转换,变量按照统一的命名规则进行映射,并进行基础的数据真实性检验。

一个具体的数据验证过程包括自动的错误纠正,或者为了保证用于数据分析目的质量而进行的清洗动作。在获取了一个同类且高质量的数据集后,一系列的诊断及预判的分析技术将被应用。下图展示了一个基本的数据库结构。



故障诊断过程通常开始于预期的系统行为模型。测量的数据的特定特征被提取(例如在一定频率范围内的变量值活着指定事件),然后用于系统相应模型的输入。这样的模型被用来定义在标准的负荷及环境条件下关键的性能参数的预期行为。

预测值雨实际测量值的差称之为残值。这个值是为了进一步从系统的健康状态中用概率分布模型来自动识别出重要的偏差,例如系统行为的趋势或者变化。

与这种诊断活动同时进行的是经过统一化和验证过后的数据集也会被用来进行故障预判。基于物理故障法的损害计算被应用来计算剩余寿命以及指定部件的故障概率和故障模式。与前面提到的诊断方法相结合,系统会自动给风机运行人员提示即将发生或者已经存在的问题(例如性能降低,故障初期等),同时会提示必须在多长时间内采取维护行动。这样一个系统,同时包含诊断和预判的能力,提供了在现场为风机调查以及按照高危故障进行分类的可能。进一步的,可以应用预测方法来预测被诊断算法识别为故障之前的预期剩余时间。

必须要强调的是,上述所提到的方法需要基于一个被良好设计的,可扩展的,且安全的软件架构上对数据进行系统的、结构化的管理。尽管在方法实现过程中,可以对数据进行手工分析,但一个风场甚至一个集团规模的系统需要最大限度的自动化:内置智能分析、清晰的报告以提示运行人员响应,因此,这样一个可以使用的解决方案实现要基于以下几个关键原则:

在实测数据中,基于信息内容的应用进行信号处理;

系统行为的物理模型;

用统计学进行模型训练,优化,趋势检测和误差预测等等;

一个可以提供自动化解决方案的IT系统;

分析过程中的主要模块将在后面进一步阐述。

5. 故障模式评估

一个有效的监测系统不仅要能识别出问题存在,还要能识别问题的本质,可能的根本原因以及应当采取的响应(例如维护行动或者修正控制策略)。此外,为了能够为子系统模型和故障模式使用恰当的、可能的技术,必须在技术、故障模型和数据之间建立连接。

一个结构化的故障模式评估模型已经开发出来生成所需要的输入。在分析过程中,风机被分成多个子系统,对于每个子系统,为了能够识别出潜在的故障,必须要执行非常专业的评估,其核心在于根本原因的识别、造成故障的机理、危险运行和环境条件。

在这样一个尽可能的评估中,需要在负荷与损害之间建立连接,例如在测量数据和一种故障模式之间。其目的是为了识别出那一个系统模型和故障检测是可能给出的输入,以及那些需要进一步测量的重点区域。如下图:

图:故障模式与可能的数据流之间关系

在这个图中,参数有功功率,可能被用来识别ABC三种故障模式的输入,故障D没有与任何可能的数据流有关联,如果认为有必要的话,可能需要定制化的设备做检测。

下图展示了一个风机发电机的部分故障模式评估的示例。这样一个评估的结果为后续的所有活动提供了参考。其定义了基本的物理和化学故障机理,可能的模型输入也被明确了。而且,这样的分析为一个专家分析系统提供了自动故障诊断的基础。

 

6. 数据验证

 

在状态监测方面,不确定性、误差传播及误差检测的最终准确性时非常重要的。为了确保误报被避免,保证用来做基础分析的数据高质量是非常重要的。

 

数据验证过程一般包含根据已定的命名转换规则进行参数映射,执行数据质量检查,有问题的通道及时间周期被尽可能的识别与纠正,数据质量问题一般会影响在10分钟的SCADA数据的情况如下:

数据丢失/NULL值/0值

数据超出合理性

统计上的离群点

大块的连续同一数据

数据格式不正确

变化的测量频率

 

针对这些问题有相应的处理方式,选择的依据要根据后面的分析性质以及准确性要求,策略如下:

用线性或指数差值纠正

设置数据的合理阈值

去除所有通道数据的时间

去除完整的通道

基于物理的随机模型模拟缺失的通道数据(要根据可利用的信息)

 

上述过程能够自动化处理时非常重要的,因此检测和纠正必须要通过智能算法处理,并且执行报告必须要能够给系统用户查看。

 

 

7. 故障诊断

广泛应用的统计学和信号处理技术对于基于时序数据的故障诊断和决策制定是可行的。这些技术包括神经网络、遗传算法、贝叶斯推理,模糊理论等其他方法。一个比较务实的方法是使用系统响应模型(也指处理模型),其是基于对系统行为及物理原理的理解。这个方法的前提是系统能够被很好的理解,那些影响系统的变量能够被监测到,以及结果能够被清楚的解读。

 

为了阐明这个方法,下面介绍一个齿轮箱模型的建模和监测案例。在一个动态负载的风机中,油温是随着时间显著变化的,功率增强导致传动链的负载更高,进而产生摩擦(在轴承,齿轮等接触处),发热,一部分热传入油中(实际上润滑油的作用就是在高负载区域去处部分热量)。因此可以预期油温和有功功率是非常相关的。而且从系统中传入热的比例取决于系统和周围环境的温度差,因此环境温度必须包括在模型中。最后必须要考虑热的惰性影响,一个时间常量需要用来正确的描述在热输入的情况下,油温的变化响应速度。在理解了这些基本的影响因素后,一个分析解决方案才能开发出来作为评估在一个给定的负载情况下预期的油温情况。

 

下图展示了一个齿轮箱的早期故障被成功检测出来时的时间与测量的油温之间的对比图。预期的油温是用系统响应模型评估的,并去测量值比较。为了能够高精度的检测到偏差,需要监测两者之间的差。

在这个例子中,一个齿轮箱的故障发生在时间戳1100处,也就是采取恰当的措施处。这个事件之前,模型能够基于二者的差值持续偏高而成功的识别出温度越限,随后进行了维修,系统的实际温度再一次与模型预期的温度相接近。这个方法的一个重要好处在于即使在部分负载情况下,偏离系统响应也能够被检测出来。其结果就是远在油温高到能触发风机控制器报警前就可以检测到初期故障。

 

类似的建模技术能够广泛的应用到风机SCADA系统中的参数中,包括齿轮箱轴承温度,发电机绕组和轴承温度,发电机电压和电流,变桨角度,转子转速,滑环温度等等。很明显,对于风机运行人员来说,能够有机会早期介入,从而避免一个彻底的系统故障,减少了停机时间以及维修成本,这是一个极大的好处。

 

如果系统响应模型能够足够准确,表明所有的物理影响都可以考虑进来。残值均匀的分布在0附近,并且符合高斯分布。实际上,在一个监控系统实现之前用这些标准检查模型的质量是非常重要的。下图展示了一个发电机的电压模型中的残值概率分布图。

这是一个高斯分布变成线性函数的转换,在这个例子中,散点值(测量值)和虚线(理想的高斯分布)之间的最小偏差的这种线性趋势确认了模型的高质量。

 

一个低质量的模型有可能导致不可接受的错误报警或无法检测到故障提示。可以通过改变分析方法或者进一步选择合适的输入参数。一旦获得了一个高质量模型,残值趋势的识别讲能够通过检查偏差的高斯分布来检测出来。这个过程为后面用软件算法自动完成做好准备,然后有效的继承到一个状态监测系统架构中来。要注意高斯分布也是可以替代的,例如伽马分布。然而由于其极好的概率特性以及适合用于描述一个明确的过程状态的随机偏差,高斯分布是首选的。

 

在实际中,我们要注意到不同的风机根据其风机规格的不同,其行为也是多样的。而且,即使对比相似规格的风机,小的差异也是可以预期的,例如改变控制系统的参数或者允许的制造公差。因此,系统响应模型必须要进行校准以适应不同的风机。在实践中,可以通过模型本身的参数化设置完成。在一个训练周期中,每台风机的系统是可以被明确定义的。一个数据集的选择要包含一个足够长的时间周期,覆盖低频率的影响(例如季节性温度影响),然后制定一个训练程序,这个程序能够通过统计回归方法修正前面提到的系数。通过这个过程,相对准确的模型就可以用一个高效的方式来获得。

 

 

8. 故障预测

在第4节我们讨论过,故障预测是故障诊断方法的一个补充。对于很多的故障模式,10分钟的SCADA数据包含了足够多的细节和分辨率,可以用来作为风机载荷历史及累积损伤的计算。

 

损伤模型是在对故障物理机理充分理解的基础上定义的。这些模型被用来将负载输入(按时序)转换为损伤增长的历史,将故障模式与指定的部件相关联。这些增长可以汇总为部件的完整的运转周期并预计故障发生的可能性。我们要注意到一个线性损伤的积累意味着Miner法则的普遍应用,虽然对于一些故障模型有合理的准确性,但这必须作为一个潜在的误差源识别出来。

 

下图展示了这样一个损伤计算的例子。在这个例子中,系统是发电机,经过研究,故障模型是绕组绝缘材料的热老化(在故障模式评估图中有识别),关于损伤动力学已经超出了本文的范围,但物理机理与热扩散过程是有联系的,可以使用与温度相关的指数来建模。在这个过程中,分析方案是用了通过测量到的发电子绕组温度来计算损伤。注意,由于温度和扩散速度之间的强非线性关系,只有一些高温事件(发生在时间戳~3400和~4300处),在所显示的时间周期中贡献了主要的损伤。

类似的方法已经应用在多种故障模式评估中识别的故障模式。这样方法在系统的识别那些运行期间高负荷的不同的风机上是十分有效的,并且在风险识别排序,考虑维修活动的优化方面提供了多种可能。

 

为了进一步的奖损伤计算值转为有关剩余寿命和(或)故障可能性的说明,所要考察的风机部件的负载能力必须要定义。这是一个挑战,尤其是风机制造过程中可能的变化以及一般情况下与实际材料特性或忍耐力等信息的缺乏。但是,通过应用统计学的寿命模型和包含有记录的现场故障作为输入/反馈的学习系统,至少可以部分克服的。

 

9. 与运维策略的集成

为了能够从这些技术所得到的描述转为利润的获取,将这样一个状态监控系统与运维策略香集成时非常有必要的。由于不同的组织可能采取不同的商业流程,这是非常有挑战的,也是很复杂的,因此一般都需要进行客户化实施。

 

有一些方面是显而易见的,要使这样一个系统有效,非常有必要记录和检测所有风机的构建状态,包括部件的规格等,。一般我们会使用一个数据库管理系统直接与监控系统集成。

 

监控系统所产生的报警和故障诊断信息必须要通过一些尽可能的清晰的、自动的报告系统呈现给运行人员,包括监测到的系统异常现象可能原因的准确描述(故障诊断)或者可能产生严重故障的描述以及预期时间(故障预测)。这些建议必须要导入运维计划,触发诸如对某些系统进一步检测的行动,备件及设备的采购,工具选择,备件送到现场,优化维修方案等。通过将这些建议转化为行动方案,数据驱动,聚焦风险的运维优化方法,在可用率提高以及盈利能力增强方面有很大的潜力。

 

10. 结论/远景

基于将风机SCADA系统10分钟数据作为状态监测工具以及运维策略的优化的好处我们已经讨论了。我们描述了一个包含工作流,软件需求和数据库架构,故障诊断和预测模型技术的完整系统。大部分故障模式的早期识别能力与识别故障概率,风险排序及剩余寿命的技术相结合,为通过提高系统可靠性,为减少关键成本提供了极大的可能。

 

为了能够提供一个成本有效和扩展的解决方案,这个方法的成功依赖与物理规律、统计学、软件工程等的有效集成。类似多种风机类型和构建状态,有效的监控大量风机并检测和预测出大部分故障模式的实际问题,需要系统最大可能的自动化。

 

所描述技术的进一步开发,将集中于扩展有效的系统响应和损伤模型。为了提升系统故障诊断和故障预测的能力,内置商业智能的水平将不断提高。进一步集成所有可能的数据源,例如包含高频的振动信号测量,在线油质分析,实时SCADA数据等,将可以为系统行为提供新的视野,在状态监测方面进行更高级别分析。

 

 

原文:Physics of Failure approach to wind turbinecondition based maintenance, C.S.Gray, S.J.Watson, Wind Energy, Volume 13,Issue 5, pp. 395-405, July 2010.