美文网首页
自由数据:数据分析的6个关键步骤

自由数据:数据分析的6个关键步骤

作者: 勤智数码 | 来源:发表于2017-08-03 09:37 被阅读0次

数据分析本身的目标是使企业能做出更好的决策。数据科学家的产品,要使得这些数据被组织中的所有人更好地使用,在每个部门和层级中,都可以作出受数据驱动的决策。

从自动收集、清洗和分析的数据产品中,可以捕获数据价值链,为执行仪表盘或报告提供信息和预测。新数据的产生使得分析工作可以自动地、连续地运行。

价值链中的一些步骤基本是固定的:

1、确定目标:获取数据之前,数据价值链上的第一步就是业务部门确定数据科学团队的目标。通常,这些目标的取得需要进行大量的数据收集和分析。因为我们研究的是驱动决策的数据,所以需要一个可衡量的方式,以此判断业务是否正想着目标前进。并且,关键权值或性能指标都应该及早发现。

2、明确业务手段:提高关键指标或达到业务目标的手段应该是业务的改变,但若是没有可以改变的,无论手机和分析多少数据都不可能有进步。在项目中越早确定目标、指标以及业务手段,越能能为项目指明方向,避免无意义的数据分析。例如,以提高客户滞留度为目标,那么其中一个指标可以是客户更新他们订阅的百分比,业务手段则可为更新页面的水,提醒邮件的时间和内容以及特别的促销活动。

3、收集数据:数据的收集需要广撒网,获取更多的数据,尤其是不同来源的数据,这能使得数据科学家能找到数据之间更好的相关性,建立模型找到更多的可行性见解。很多时候,大数据经济意味着个人记录基本是无用的,拥有可供分析的所有记录才能产生真正的价值。公司通过检测它们的网站来密切跟踪用户的点击及鼠标移动,商店通过在产品上附加RFID来跟踪用户的移动。

4、清洗数据:数据价值链中最关键的步骤是提高数据质量。数据科学家要纠正拼写错误,处理缺失以及清除无意义的信息。即便是最好的分析,也有可能产生错误的结果,甚至舞蹈业务本身。尤为重要的是,这一步规模化的执行是必须的,因为连续数据价值链要求传入的数据会立即被清洗,且清洗频率十分高。这一过程通常是自动执行,但并不意味着不需要人的参与。

5、数据建模:提出关于在第一部中确定的业务手段变化的建议,前提是数据科学家构建模型,关联数据与业务成果。数据科学家必须有良好的统计学和机器学习背景,才能构建出科学、精确的模型,避免无意义的相关性以及模型陷阱。这些模型依赖于现有的数据,但对于未来的预测是无用的。除此之外,数据科学家还需要很号的了解业务。

6、优化和重复:数据价值链其实是一个可重复的过程,能够对业务和数据价值链本身产生连续的改进。基于模型,业务将根据驱动手段作出改变,数据科学团队来评估结果。在此结果的基础上,企业可以决定下一步计划,而数据科学团队继续进行数据收集、数据清理和数建模。企业重复这个过程越快,就能越早修正发展方向,越快得到数据价值。

相关文章

网友评论

      本文标题:自由数据:数据分析的6个关键步骤

      本文链接:https://www.haomeiwen.com/subject/fubulxtx.html