近期在任职的公司启动劳动防护用品系统的建设,寄希望通过劳保系统的建设从新梳理内部劳保用品的标准、实现情况、规范劳保用品业务后期相关操作,明确责任主体工作,在劳保管理系统建设期间启动了多次对业务数据的清洗和分析工作,所以萌生了写此文的想法。
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解消化,已求最大化地开发数据的功能,发挥数据的作用,在本次劳保用品分析工作中总共包括三大主要工作:1、现状分析,2、原因分析,3、预测分析。
1、现状分析,现状分析就是告诉用户过去发生了什么;
2、原因分析,就是想要告诉用户某一个事情为什么发生;
3、预测分析,就是告诉用户将来发生什么。
做任何事情之前都要先明确目的,数据分析的目的不是做出了多少数据,做了多少张好看的图表,要解决的事情是:降低费用,规范相关制度,规避系统上线因为数据带来的大部分问题。
明确了目标然后是确定方法,本次数据分析采用的是逻辑树分析法,使用逻辑树分析能保证解决问题的过程的完整性,它能将工作细分为便于操作的任务,确定各部分优先顺序,明确地把责任落实到个人,这也是使用逻辑树的主要原因。
确定方法之后是数据收集,数据收集是按照确定的数据分析框架,收集相关的数据的过程,它为数据分析提供了素材和依据,本次数据收集包括2部分内容:1、数据库,劳保用品在2019年6月前有系统做支撑,可以有效的利用起来;2019年6月-12月有ERP系统出入库做支撑。2、电子凭证,excel的发放记录。3、标准的制定,excel整理,制定的excel模板如下:
未命名图片.png
图1-发放纪录模板
未命名图片1.png
图2-物料主数据模板
未命名图片2.png
图3-劳保类型模板
未命名图片3.png
图4-套餐标准模板
未命名图片4.png
图5-岗位与套餐对应关系模板
数据处理,数据处理就是数据拿到后该怎么办?要怎么处理?要提炼出哪些信息出来?需要给用户展示哪方面的结果。虽然前期制定了数据模板规定了字段的格式,数据会是你想要的样子吗?我们这次遇到的就是这种杂乱无章、残缺不全的数据,这个时候就需要有清洁工的精神,一点一点将它弄的井井有条、干干净净。数据处理按照步骤总共可以分为两步:数据清洗与数据加工。
第一步数据清洗
数据清洗就是将多余重复的数据筛选清楚,将缺失的数据补充完整,将错误的数据纠正或删除
1、重复数据处理,对于发放纪录,分析之后的数据只要最后一次领用纪录,需要将历史领用纪录筛选处理,并进行删除操作,具体的删除逻辑不在这里进行详细介绍。再进行文件导入之前手工处理了一下数据,收集的发放纪录是身份证号,新上线的系统使用工号,用excel进行手工匹配后导入,用到了excel中一个比较重要的函数就是VLOOKUP函数,它可以用来核对数据,多个表格之间快速导入数据等函数功能。功能是按列查找,最终返回该列所需查询序列所对应的。
未命名图片5.png
图6-重复数据处理代码
未命名图片6.png
图7-vloopup匹配工号
2、缺失数据处理,缺失数据是指数据集中某个或某些属性的值是不完全的,主要分为机械原因或者人为原因。对于本次数据分析工作来说这部分数据问题是提供的发放纪录不包括公司所有人员,缺失的人员发放纪录如何补充完整。期初数据导入到系统后点击刷新标准,没有提供期初的人员也会刷出按照标准的物料。
未命名图片7.png
刷新完劳保标准之后select t.*,t.rowid from LP_CG_STANDARD t where t.pre_dt is null查询领用时间缺失的人员相关信息,找负责提供领用信息的人员补充缺失的领用时间。
未命名图片8.png
在导入期初数据时领用时间没有按照要求的格式提供,手工在excel进行了格式化处理。
未命名图片9.png
3、错误的数据纠正或删除,错误数据一般是怎么出现的?以这次劳保用品分析为例,一边拿会有两种错误形式:与标准不匹配和领用时间错误。
对于第一种与标准不匹配的领用信息数据导入时时生成报错日志,可以通过select * from LP_ERRORIF查询
未命名图片10.png
对于第二种领用时间错误的,系统通过领用时间+计算周期得出下次领用时间,使用润乾报表做了一个二维统计表,使用交叉分析法帮助用户发现潜在问题并解决。交叉分析法通常用于分析两个变量(字段)之间的关系,就是将两个有一定联系的变量及其值交叉排列在一张表格内,使各变量成为不同变量的交叉结点,形成交叉表,从而分析交叉表中变量之间的关系,表左侧是物料名称,右侧是月份。
未命名图片11.png
工作进行到这一步现状分析和原因分析就都做完了,然后是预测分析,也就是数据展示,结合系统运行的要求需要对以下内容进行预测:按年的需求量预测(提前通知供应商备货 )、整单兑现率(评价供应商供货能力)、劳保用品统计(按年度统计劳保费用)、形成两个清单洗漱用品清单和衣服特体清单。
数据展示不一定都要用图表,按年的需求量预测使用突出显示的单元表格更为合适,具体如下:
未命名图片12.png 未命名图片13.png
整单兑现率采用结构分析法,属于相对指标 兑现率=(不重复需求计划号/需求计划号)×100%
未命名图片14.png本次劳保用品分析工作经过现状分析、原因分析、预测分析就全部结束了,专业是一种长期的修为,不是一时一刻就能达到的。所以永远不要满足与现状。‘路漫漫其修远兮’,要不断努力,怀揣永不厌倦的好奇心和进取心,才能走向卓越。
网友评论