简单性的优势:一个轻量级的网络设备工作负载预测模型
Submitted on 7 Jul 2020
回复 ts14获取论文及项目源码
摘要IT系统的快速增长和分布增加了它们的复杂性,并加剧了操作和维护。为了维持对大型主机集和连接网络的控制,使用并不断增强监控解决方案。它们收集不同的关键性能指标(kpi)(例如CPU利用率、分配的内存等),并提供关于系统状态的详细信息。在一段时间内存储这样的度量标准自然会增加基于过去的观察来预测未来KPI进展的动机。尽管存在各种时间序列预测方法,但预测IT系统kpi的进展是非常困难的。首先,像CPU利用率或分配的内存这样的KPI类型非常不同,很难用同一个模型来表示。其次,系统组件是相互连接的,并且由于软或固件更新和硬件现代化而不断变化。因此,必须预期频繁的模型再培训或微调。因此,我们提出了基于历史观测的KPI系列预测的轻量级解决方案。该方法由一个神经网络模型和一个平均预测器两个模型组成。集成方法采用加权求和法,采用启发式方法确定权重。建模方法在可用的FedCSIS 2020挑战数据集上进行评估,在初步的10%测试数据上获得总体R2得分为0.10,在完整测试数据上获得0.15。
模型概述图1所示。用于6台主机的4个kpi示例。可以观察到不同主机之间和内部的KPI值差异很大。这表明在预测kpi的预期未来值时面临的主要挑战。
图2所示。整体解决方案体系结构。
总结我们处理给定的挑战网络设备工作负载预测基于KPI数据与轻量级模型,该模型集合了多层线性神经网络的预测和总体平均预测。这个集合是由一个加权求和完成的。启发式被用来选择性地为两个模型的预测设置权重。该方法的轻量级性质允许为每个KPI培训单个模型,以尊重不同的性质、不同的KPI类型和主机。从实践的角度来看,频繁的再培训需要是可行的,这也得到了解决方案轻量级特性的支持。
为了评估我们的解决方案,我们进行了两种类型的实验。首先,我们使用FedCSIS 2020挑战数据集评估我们的解决方案。它由从3716个主机记录的45个不同的kpi组成。实验结果表明,轻量级方法预测未来的KPI值,对初步的10%测试数据的总体R2得分为0.10,对完整测试数据的总体R2得分为0.15。其次,我们提供了LSTM和线性网络单元之间的运行时分析,表明使用LSTM单元使训练时间增加了10倍,这使得它无法用于给定的问题。
在未来的工作中,我们看到了对不同网络类型的进一步实验,如卷积神经网络或注意力机制的前景。此外,对当前使用的元信息进行不同的数字编码,以及在聚合总体平均值和神经网络输出时学习总和权值,都是潜在优化的来源。
扫码关注我们
微信号 : zzh1464501547
qq群:966308496
今日头条:人工智能学术前沿
知乎:人工智能学术前沿
网友评论