美文网首页闲话工业4.0物联网之家
预测性维护怎么玩之科普篇

预测性维护怎么玩之科普篇

作者: FrankZ2016 | 来源:发表于2018-08-14 08:49 被阅读0次

    引言

    预测性维护可以算是智能制造中比较火的应用场景了,其中涉及了以机器学习为核心的众多先进技术。在这里做个科普讲座,希望通过本文能够帮助大家了解设备预测性维护的总体过程和原理。

    什么是预测性维护

    首先看一下设备维护的四种方式,如下图:

    设备维护的发展阶段

    在这里,我们所要讨论的预测性维护指的是利用设备运行的状态信息、环境信息等各种数据,主要基于数理统计模型,对故障进行预测。

    预测性维护的重要意义在于避免过度维修,节约设备维护成本。

    预测性维护的实施步骤

    前提条件

    要有一定的数据积累

    这里所说的数据积累包括两个方面:数据的种类和数量

    在种类方面,至少要有两类数据才能够进行预测模型的建立和训练,即故障数据以及设备运行的状态数据。在建立和训练模型的过程中,前者是模型的输出,后者是模型的输入。

    在数量方面,究竟多少的数据量是足够的呢?

    答案可能会让大家失望——在没有建立和测试任何模型之前,是没办法确定最终需要多少数据的,而且在这个阶段几乎也没有太多简单的经验规则可以参考。

    因此,对于数据量来说,只能是多多益善。并且,我们能够确定的是,某些数据是需要尽可能多的数据量,比如,设备的故障数据、在设备发生故障之前的一定时间窗口内的设备状态数据(电压、电流、振动等等)。

    不同的预测结果及建模方法

    预测的结果可以分为以下两种:

    • 离散型的预测结果,即结果为一系列有限的值之一,比如“是”或“否”。例如,在未来的一定时期内,设备是否会发生故障。这里将采用分类模型进行建模。
    • 连续型的预测结果,即结果为一个数值。例如,设备会在未来的什么时间点发生故障,或者说,设备剩余有效使用寿命是多少。这里将采用回归模型进行建模。

    相比于回归模型,分类模型虽然给出的预测结果相对简单,只有“是”或“否”,但是所需的数据量也要少一些。

    模型的评价指标

    对于回归模型,可以采用均方根误差Root Mean Squared Error作为评价指标:

    均方根误差

    对于分类模型,可以采用准确率(accuracy),召回率(recall)等作为评价指标,大家可自行百度一下具体定义。

    注:准确率描述的是如果这个模型总共做了N次的预测,那么共预测对了多少次,召回率描述的是在实际发生的N次故障中,该模型共预测对了多少次。当然,这两个指标最后都是用比率来显示的。

    预测性维护建模的过程

    预测性维护的建模过程与一般的预测分析是一样的。

    假设我们已经搜集到了一定量的历史数据,包括故障数据以及设备运行状态的数据。下面以回归模型为例,对预测模型的建模步骤进行简要介绍。当然,这部分核心工作就需要我们的数据科学家登场了。

    在实际应用的过程中,下图中虚线框中的几个环节会迭代进行,直到获得符合期望目标的预测模型。

    建模过程

    1 选取模型

    数据科学家首先会使用各种算法模型进行尝试,对我们已有的数据进行拟合。在这个阶段,一般会先从简单的模型开始尝试,比如线性模型等,并以此作为与其他模型比较的基线。

    这里需要注意的是,“选取模型”、“数据预处理”、“特征工程”、“超参数优化”这四个步骤并不是瀑布式进行的,而是迭代进行的,最初选定的模型也有可能在后期发生改变。

    2 数据预处理

    这部分工作的目的是,将原始数据转换成模型输入所需要的数据格式,包括对各类数据的度量单位的统一,或一些明显有问题的数据的排除等等。当然,有些预处理工作也可以在模型选择之间进行,比如对误差数据的排除。

    3 特征工程

    如果我们把模型简单理解为一个函数表达方式y=f(x1、x2、x3.....)的话,那么,特征就是其中的自变量x1,x2......。

    特征工程可以理解为对模型输入变量进行处理的过程。这个处理的过程分为两种:

    一种是增加特征,也就是在原有的原始变量的基础上,再应用各种方式生成新的自变量,比如x1和x2的平均值。但是,需要注意的是,生成的新的变量一定是在预测性维护的场景中有实际意义的。这就需要相关业务知识做基础了。

    另一种是减少特征。例如,应用设备方面的知识,在众多的输入变量中选择出与预测结果有密切关系的自变量。

    4 超参数优化

    超参数的优化就是对我们所选取的模型的一些参数进行优化,使模型的预测性能指标更精确。

    如果说特征工程是对自变量x所做的工作,那么超参数优化就是对函数f做的工作——调整f的各种参数。

    5 模型评估

    在根据历史数据建立好模型以后,我们需要对该模型进行评估,也就是用另外一些在建模过程中没有使用过的数据进行模型测试,看看预测的效果到底怎么样。这部分测试模型的数据是一般在建立和训练模型之前,从历史数据中划分出的一部分数据,通常叫做测试集数据。

    6 模型部署

    模型建立好之后需要部署到实际的生产系统中运行,不断地接收从设备层采集到的数据,进行预测分析。

    模型的部署涉及到了工业现场的数据采集、企业服务总线等技术。

    预测性维护(predictive maintanence)与基于状态维护(condition-based maintenance)的关系

    可以将二者相结合,共同发挥作用。

    “预测性维护”是基于数理模型的,完全是从数据出发建立模型。而“基于状态维护”是基于设备机理模型的,依靠的是对相关领域知识的理解。因此,两者充分结合,往往能够发挥更好的效果。例如,在特征工程中,往往会利用机理模型,也就是设备的领域知识来产生有实际意义的新特征,加快模型建立与训练的过程。

    目前做预测性维护的困难

    最大的困难是工业现场数据的缺乏

    建立及训练预测性维护的模型至少需要两类历史数据——故障数据(即计划外停机的数据)以及设备运行状态数据(例如电压、电流之类)。并且这两类数据的数量要足够大,这样训练出的模型才更为准确。

    但是很多设备的停机故障发生概率很低,可能一年也没几次,因此,这类数据的收集就需要很长时间。

    此外,很多工业现场并没有完善的设备数据采集系统,或者即使有一些SCADA之类的系统,也更多是完成实时状态监控,对于设备运行的状态数据,只保存了很短的时间(如3个月),缺乏设备数据的长期保存。

    参考资料

    本文参考了书籍《预测分析:R语言实现》,以及一篇文章《Machine Learning Techniques for Predictive Maintenance》。


    欢迎转载,转载请注明出处。

    如果想获得更多关于智能制造以及物联网方面的文章,关注我的公众号“聊聊智能制造那些事”,查看历史消息即可。

    相关文章

      网友评论

        本文标题:预测性维护怎么玩之科普篇

        本文链接:https://www.haomeiwen.com/subject/jncfbftx.html