本文陆续汇总一些看到的、思考总结的东西。先不求条理性,后期再整理好。
一、数据思维
定义引用某处看到的:“数据思维,即从数据中发现问题、解决问题的能力”
数据思维从何而来:“我们对掌握的数据知识和技能形成的一些认知”,涉及到思维,免不了都有点形而上的意味
以下围绕数据思维做一些展开:
数据思维的底层:数据敏感性
什么是数据敏感性?一个专业厨师对火候、刀工、辅料配比的控制肯定要比一个普通人强。当你看见一个美女时,你只会“卧槽”,而你的好基友脱口而出“8分”时,你们2个人的数据敏感性立分高下。这样,我们引出了数据敏感性的关键要素:定量、精确。并且对临界值敏感。
如何发现问题
要发现问题,首先要发现数据中隐藏的信息,而发现隐藏信息,一般有三种方式:
- 假设检验:先预设观点,而去检验
- 逻辑推理:通过逻辑发现问题
- 变换视角:从不同视角看,会有不同的问题
如何解决问题
要解决问题,得先明确问题,这样可以节省大量不必要的时间,这里包括三个方面:
- 问题的本质是什么?是否可以简化?
比如老板问你这个月收入为什么比上个月少30%,你得知道“这个月”与“上个月”使用的是什么数据对比,第一步就是对齐问题的理解,然后你得通过历史数据、市场行情判断下降30%是较好、正常还是较差,如果是较好或正常,这个问题直接就不成立了。 - 问题要达成的目标是什么?
如果历史数据表明,两个月之间的收入变化有10%的波动,那么就需要与老板对齐:是不是收入变化在10%以内就算达成目标了? - 可利用的资源有哪些?
清楚了问题后,可能需要各个部门的配合,所以还需要跟老板沟通好:自己是否有权提取必要的数据?
总结以上,构建问题包括明确问题和回顾历史数据
接下来就是技术性工作了,包括问题建模,选择需要的变量,收集数据,分析数据,传达结果,采取行动。
数据分析师有什么价值
- 呈现决策数据
搭建数据监控体系是重要的呈现决策数据的手段。对于数据监控体系指标的选取标准:一是重要性,二是不可替代性,三是可落实责任人 - 定位数据问题
- 探索数据价值
二、数据分析师的成长之路
- 入门思维:细分思维(横向指标拆解,纵向时间),对比思维(不同时间、不同处理后的数据变化),联系思维(变量间影响关系)
- 数据思维:见上
- 企业中成长三板斧:混(与业务部门人员混在一起)、通(数据不是孤立的,要与商业问题相结合)、晒(晒出分析报告,得到反馈)
- 批判性思维:区分事实与观点,判断相信哪些
- 横向思维:出现问题,分析为什么是常理,但思考“还可能会出现什么结果”或许很有价值,不能只见树木不见森林
- 主干思维:一个问题的关键要素一般只占20%(打个比方),先解决关键部分是首要的
- 边界思维:解决了主干后,枝叶要解决到什么程度,需要从成本、效益、效率等角度权衡
- 逻辑思维:三段论(前提、逻辑严谨、结论正确)
- 业务思维与商业思维:业务思维就是针对指定数据,能够给出科学合理的业务解释及业务意义(业务角度),商业思维就是思考如何挣钱以及如何更高效率的挣钱(老板角度)
三、常见分析目的与对应方法
- 简化问题:逻辑树
- 战略规划:PEST(政治、经济、社会、技术)、SWOT(优势、劣势、机会、威胁)、波特五力(供应商的议价能力、购买者的议价能力、潜在竞争者进入的能力、替代品的替代能力、行业内竞争者现在的竞争能力)
- 开放性思考:多维拆解
- 假设检验:T检验、U检验、非参数检验
- 用户行为分析:AARRR漏斗(获取、激活、留存、收入、自传播)
- 用户价值分类:RFM(最近购买时间、频次、金额)
- 流失分析:群组分析
- 财务分析:杜邦分析
- 需求优先级:KANO
- 分类:聚类(样本分类与指标分类)、矩阵分析、判别分析
- 相关分析:(协)方差分析(定类-定量)、卡方检验(定类-定类)、因子分析、线性规划、Mentel-Hanszel分层分析(三维表)、关联规则挖掘
- 对比分析:PSM(倾向得分匹配)
- 描述统计:集中趋势、偏度、峰度、异常值与缺失值、正态检验
- 信度分析(测量的可信度,如调查问卷真实性):外在信度(重测信度:不同时间测量的一致性)、内置信度(分半信度)
- 回归预测:线性回归、逻辑回归
- 时序预测:ARIMA、RNN
- 生存分析:Cox比例风险回归分析法、AFTSurvivalRegression(加速失效时间生存回归)
网友评论