数据分析的本质
数据分析的本质:利用事实的数据,对现状进行分析,推导出最接近事实的真相,并形成决策的结论。
数据分析的流程
商业数据分析流程,主要有以下几个流程:
1、现状和预期:所谓的“问题”其实是随着当时商业环境下产生的“预期”而变化的。也就是说,有了“原来的预期”和“现状”之间的差距,才会导致问题的出现。
2、发现问题:“牢记没有问题的状态=预期”就是一种找出问题所在的有效方法。如何理解“预期”和“现状”之间的差距呢?在使用数据分析的方法中,通常的处理方法是首先从下面的角度来观察数据。
(1)、观察数据的大小;
(2)、将数据分解后观察;
(3)、将数据比较后观察。
发现问题的第一步:可以提出基础假设,有哪些可能的原因会导致这些问题的产生。
然后运用排除法,逐步进行排除,剩下的留下来的那个问题,就是最终需要用数据验证的主题。
3、数据的收集和加工
确认好问题后,就需要找到相应的数据,可以从相应的数据库中获得。
获得完后,需要对数据进行加工或清洗,筛掉不良数据。
4、数据分析
数据分析需要用到统计学的相关知识,比如运用卡方检验来进行假设检验,建立预测模型,用回归分析来发现两者之间的相关性。
这一点是数据分析的重点。需要重点了解需要解决什么问题,得出什么结论,用到哪一种数据分析方法。
5、解决对策
根据数据分析的结果,得出数据分析的结论。并根据这个结论得出决策。
数据分析的案例
下面我们以一个简单得到案例来阐述一下数据分析的过程。
某公司再互联网上投放了一款游戏的广告,同时也在传统媒体上投放了广告。基于过去其他游戏广告的数据,他希望能够获得效果最好的广告投放方式,此时应该怎么做?
1、现状和预期
现状:公司在多家媒体已经投放广告。需要在已有合作关系的媒体中决定如何分配广告投放的比例,以达到“用较少的费用获得更多的用户”的目的。
预期:机遇现有的数据,弄清楚广告和获得用户数量之间的因果关系,并找出最合适的广告投放分配比例。
2、发现问题
问题细化:在传统媒体上的广告投放分配比例存在问题——>每月在电视和杂志上投放广告的比例有所不同。
问题步骤:
1、基于过去的数据,明确在电视和杂志上投放广告的广告费和各自所获得的用户数之间的关系。
2、基于上述关系,确定以何种比例在电视和杂志上投放广告。
确定分析方法:
多元回归模型的分析方法
先构筑一个可以预估各广告媒体能带来的用户量的模型,再决定广告的投放方式。
根据回归分析进行如下假设:
1、原因数据真的会对结果数据产生影响吗?广告费(自变量)的变化真的会对新用户数(因变量)产生影响吗?
2、如果确实有影响,那么这是一种怎样的关系呢?
数据收集
投放的媒体分为互联网、电视和杂质。
在这3个广告媒体中,由于互联网广告的效果可以直接测定,因此哪个网站的广告有什么样的效果,其CPI很明确。
然而,由于电视和杂志广告,我们只能获取总体的用户数增加了这类粗略的信息。因此,我们排除了互联网广告所带来的新用户,将剩余的新用户数和花费在电视以及杂志上的广告费作为分析用的数据。
经和市场部确认得知,这些数据一直都在用excel管理。
数据分析
通过建立多元回归的模型,用数据得出相关系数。
新用户=a电视广告费+b杂志广告费+188
a=1
b=7
也就是在电视上投1块钱,就能获得1名新用户。
在杂志上投1块钱,就能获得7名新用户。
解决对策
结论:相比于电视广告,杂志广告的效果要更好一点。
所以决定在杂志广告上多投入一些。
网友评论