最近打算做一些库存预测方面的预测分析,记录一下当前的进展。
首先我拿到了历史的数据明细,主要都是大的Excel文件,打开来非常费劲。
下面的处理思路一方面是构建一个大数据平台,按照以往的经验对数据进行序列化,然后通过一些开源的机器学习编写指数预测模型,但这条路太坎坷。
还有一条就是直接利用Excel自身的预测分析功能,但是原始Excel过大,所以说没有办法直接分析,需要按照与并且按照频率进行汇总之后才能分析。
根据宇宙的需求,我先安装了一个桌面的ETL工具,将Excel全部转成高速的数据库文件,然后基于这些数据库文件,对数据进行初步的筛选和过滤。同时将数据汇总之后按照月度进行统计,同时按照物料进行分类。
最后这些数据同时可以根据要求导入到SQL当中。
数据有了,下面是工具分析。目前主要采用了一些标准的统计学软件,通过输入一些每月的统计量可以对时间进行预测分析。
由于我的数据相对来说比较多,可以将前半部分的数据作为预测的基础加后半部分数据进行预测对比。
目前选择计划权的几个标准的模型完成对比之后就可以承包研究结果。
网友评论