1、数据分析的定义:用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。需要把一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。
2、数据分析的作用:为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。能够帮助管理者进行判断和决策,以便采取适当策略和行动。数据分析在企业的日常经营分析中主要有三大作用:现状分析、原因分析、预测分析。
2.1 现状分析:告诉你企业现阶段的整体运营情况,通过各个经营指标的完成情况来衡量企业的运营状态,以说明企业整体是运营是好了还是坏了,好的程度又如何,坏的程度又如何。
2.2 原因分析:告诉你企业为什么会出现某一现状,即找出业务变动的具体原因。
2.3 预测分析:通过了解企业运营的现状,对企业的未来发展趋势作出预测,为企业制定运营目标及策略提供有效的参考与决策依据,以保证企业的可持续健康发展。一般通过专题分析来完成,通常在制定企业季度、年度等计划时进行,其开展的频率没有现状分析及原因分析高。
3、数据分析分描述性数据分析(属于初级数据分析,常见的方法有对比分析法、平均分析法、交叉分析法)、探索性数据分析(侧重于在数据中发现新的特征)、验证性数据分析(侧重于验证已有假设的真伪)。后两种属于高级数据分析,常用方法有相关分析、因子分析、回归分析等。
4、数据分析六部曲:明确分析目的和思路、数据收集、数据处理、数据分析、数据展现、撰写报告。
5、明确分析目的后,需要梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点:如何具体开展数据分析,需要从哪些角度进行分析,采用哪些分析指标。先明确分析目的,在确定分析框架,确保分析框架的体系化(即逻辑化,先分析什么,后分析什么,使各个分析点之间具有逻辑联系),使分析结果具有说服力。
6、分析框架体系化的要领:以营销管理等理论为指导,结合实际业务情况,搭建分析框架,才能确保数据分析维度的完整性,分析结果的有效性及正确性。
7、数据收集:按照确定的数据分析框架,收集相关证据的过程,为数据分析提供了素材和依据。数据来源渠道:数据库、公开出版物、互联网、市场调查。
7.1 第一手数据:可直接获取的数据;
7.2 第二手数据:经过加工整理后得到的数据。
8、数据处理:指对收集到的数据进行加工整理,形成适合数据分析的样式,即通过数据处理,将收集到的原始数据转换成可以分析的形式,并保证数据的一致性和有效性。目的是从大量的、杂乱无章、难以理解的数据中,抽取并推导出对解决问题有价值、有意义的数据。数据处理主要包括数据清理、数据转化、数据提取、数据计算等处理方法。
9、数据分析:指用适当的数据分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
10、数据分析和数据挖掘之间的关系:本质是一样的,都是从数据里面发现关于业务的知识。数据挖掘就是从大量的数据中挖掘出有用的信息,它是根据用户的特定要求,从大量数据中找出所需的信息,以满足用户的特定需求。数据挖掘是一种高级的数据分析方法,侧重解决四种数据分析问题:分类、聚类、关联和预测,重在寻找模式和规律。
11、数据表现:通常是通过表格和图形的形式来呈现的。常见的数据图表有:饼图、柱状图、条形图、折线图、散点图、雷达图等;也可将这些形式的图表加工成金字塔图、矩阵图、漏斗图、帕雷托图等。
12、撰写报告:数据分析报告是对整个数据分析过程的一个总结与呈现。借助报告完整地呈现数据分析的起因、过程、结果及建议,供决策者参考。即数据分析报告是通过对数据全方位地科学分析来评估企业运营质量,为决策者提供科学、严谨的决策依据,以降低企业运营风险,提高企业核心竞争力。好的数据报告需具备以下特点:
12.1 有一个好的分析框架,并且图文并茂,层次明细,能够让阅读者一目了然。
12.2 数据分析报告中需给出明确的分析结论。
12.3 好的数据报告一定要有建议或解决方案。这就要求数据分析师不仅需要掌握数据分析方法,而且还要了解和熟悉业务,这样才能发现业务的问题,提出具有可行性的建议或解决方案。
13、数据分析的三大误区:
13.1 分析目的不明确,为分析而分析。注意围绕你的分析目的(了解现状、找出业务变动的原因、预测发展等)而进行分析
13.2 缺乏业务知识,分析结果偏离事实。在企业中所作的数据分析不是单纯的数据分析,而是需要多从业务方面进行分析,不应该停留在数据表面,要思考数据背后的事实与真相,使得分析结果更加切合实际,为老板的决策提供有力的支撑。
13.3 一味追求使用高级分析方法,热衷于研究模型。围绕业务发现问题并解决问题才是数据分析的最终目的,高级的数据分析的方法并不一定是最好的,能够简单有效解决问题的方法才是最好的。
14、数据分析中几个常用的指标和术语:
14.1 平均数:非常重要的基础性指标,特点是将总体内各单位的数量差异抽象化,代表总体的一般水平,掩盖了总体内各单位的差异。
14.2 绝对数:是数量,反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,也是数据分析中常用的指标。可以表现为在一定时间、地点条件下数量增减变化的绝对数。
14.3 相对数:是质量,指两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标。计算相对数的基本公式是:相对数=比较数值(比数)÷基础数值(基数)
14.4 百分比与百分点:百分比是相对数中的一种,表示一个数是另一个数的百分之几,也称百分率或百分数,通常用%来表示。百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。
14.5 频数与频率:频数是指一组数据中个别数据重复出现的次数,是绝对数。频率是每组类别次数与总次数的比值,代表某类别在总体中出现的频繁程度,是相对数。一般采用百分数表示,所有组的频率总和为100%。
14.6 比例与比率:比例是指在总体中各部分的数值占全部数值的比重,通常反应总体的构成和结构。比率是指不同的类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分的关系。
14.7 倍数与番数:均属于相对数。倍数是一个数除以另一个数所得的商。番数是指原来数量的2的N次方倍。
14.8 同比与环比:同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。
网友评论