在现实生活中,无论公司还是个人,几乎每天都要面对各种问题和选择,我们不禁要想如何才能透过现象看本质发现问题的本源所在?如何才能做出科学正确的抉择?而数据分析可以替我们拨开迷雾发现真相,为我们的抉择提供有力的数据支撑,所以学习数据分析无论对公司的运营还是个人的选择都大有裨益。
数据分析思维是这个时代更高层次的元认知能力,这篇文章是记录我数据分析学习历程的第一篇文章。
数据分析的定义:
用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
数据分析的目的:
为了提取有用的信息和形成结论而对数据加以详细研究和概括总结的过程。
数据分析的分类:
- 描述性数据分析:属于初级数据分析,以对比、平均、交叉等分析法描述数据;
- 探索性数据分析:侧重于数据之中发现新的特征;
- 验证性数据分析:侧重于验证已有假设的真伪证明。
数据分析在企业的日常经营分析中主要有三大作用:
- 现状分析:通过指标衡量企业现阶段的整体运营情况和各项业务的构成;
- 原因分析:通过专题分析对企业运营中某一现状进行原因分析;
- 预测分析:对企业未来发展趋势做预测,为制定企业运营目标及策略提供有效的支撑。
数据分析六部曲:
- 明确分析目的和思路:为什么要开展数据分析?通过数据分析需要解决什么问题?同时,要以营销、管理等理论为指导,结合实际业务情况,搭建分析框架;
- 收集数据:一般来自数据库、公开出版物、互联网、市场调查等;
- 数据处理:包括数据清洗、数据转化、数据提取、数据计算;
- 数据分析:用适当的分析方法和工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程;PS:数据分析和数据挖掘的关系:数据挖掘是一种高级的数据分析方法,数据挖掘侧重解决分类、聚类、关联和预测四类数据分析问题,两者本质都是数据里面发现关于业务的知识。
- 数据展现:以人们更愿意接收的图形展现方式,有效、直观地传递出分析师索要表达的观点。一般情况下,能用图不用表格,能用表格不用文字。
- 报告撰写:是对整个数据分析过程的一个总结和呈现
- 要有好的分析框架,并且要图文并茂、层次明晰;
- 要有明确的结论;
- 要有建议或解决方案。
数据分析的三大误区
- 分析目的不明确,为分析而分析;
- 缺乏业务知识,分析结果偏离实际:数据分析师必须要懂营销、懂管理,更要懂策略;
- 一味追求使用高级分析方法,热衷研究模型。
数据分析师的职业要求:
懂业务、懂管理、懂分析、懂工具、懂设计
数据分析师的基本素养:
- 态度严谨负责,保证数据的客观、准确;
- 好奇心强烈,积极主动地发现和挖掘隐藏在数据内部的真相;
- 逻辑思维清晰,结构为王,理清结构中相互的逻辑关系;
- 擅长模仿学习,领会他人方法的精髓,理解其分析原理,透过表面达到实质;
- 勇于创新,不断总结分析方法、分析思路、分析流程,在总结中创新前行。
常用指标和术语:
- 平均数:将总体内各单位的数量差异抽象化,代表总体的一般水平,掩盖总体内各单位的差异;
- 绝对数和相对数:相对数相比较于绝对数具有比较属性,反应比较对象之间数量联系程度;
- 百分比和百分点:1个百分点=1%,表示构成的变动幅度不宜用百分数,而应该用百分点,如:公司今年的利润是45%,比去年的28%提高了17个百分点。
- 比例和比率:比例是指在总体中各部分的数值占全部数值的比重,通常反应总体的构成和结构;比率是指不同类别数值的对比,它反应的不是部分与整体之间的关系。如男生比例,男女比率。
- 倍数和番数:倍数是一个数除以另一个数所得的商,番数是指原来数量的2的N次方倍,翻两番为4倍。
- 同比和环比:同比是指比历史同时期进行比较得到的数值,主要反应事物发展的相对情况如2018年4与2017年4月相比;环比是指与前一个统计期进行比较所得的数值,主要反映事物逐期发展的情况,如2018年4月和2018年3月相比。
总结:虽然只是一些概念的总结,但所谓正本清源,通过梳理这些概念,纠正了我以前对数据分析的几点错误认知,也是有些收益。
本文为《谁说菜鸟不会数据分析-入门篇》第一章读书笔记
网友评论