一、数据分析的基本流程
确定----分解----评估----决策
确定:确定问题,了解问题;
分解:数据分析总的来说就是分解问题和数据,使其成为更小的组成部分;
评估:这才是分析大餐,在这一步对前两个步骤了解到的情况作出各种结论;
决策:最后,把这些结论重新组合在一起,作出(建议)或一个决策;
你的客户可能:
相当了解或不甚了解自己的数据;相当了解或不甚了解自己的问题或目标;相当了解或不甚了解自己的业务;目标明确或优柔寡断;头脑清醒或稀里糊涂;富有直觉或善于分析;
如果能够对客户了解越深(问对问题),你的分析越有可能派上用场;
二、务必明确你的心智模型
1、什么是心智模型?
你对外界的假设和你确信的观点就是心智模型;
2、统计模型取决于心智模型:心智模型决定你的观察结果,是你观察现实的棱镜;
3、如果用错了心智模型,分析会胎死腹中;
第二章 验证你的理论
通过做实验来验证你的理论,并且帮助自己做决策;
再没有什么办法能像一个好实验那样,既能解决问题又能揭示事物的真正运行规律。
一个好的实验往往能让你摆脱对观察数据的无限依赖,能帮助你理清因果联系;可靠的实证数据将让你的分析判断更有说服力;
观察分析发充满混杂因素,混杂因素就是研究对象的个人差异它们不是你试图进行比较的因素,最终会导致分析结果的敏感度变差;拆分数据块,管理混杂因素;}$
第三章 最优化
第五章 证伪法--假设并非如此
一、评估一个事件发生的未来预测,需要把这个事件相关的各种变量间的关系进行圈点,同升同降,关系为“+”,背道而驰,关系为“-”,变量之间可以正相关也可以负相关,尽可能多的发现变量,并标注关系;
二、现实世界中的关系呈网络关系,而非线性关系,线性关系等于直觉;
三、根据网络关系形成假设;
四、假设检验的核心是证伪,请勿试图选出最合理的假设,只需剔除无法证实的假设;
五、进行假设检验时,要使用证伪法,回避满意法;对假设进行评级,不利证据越少的排在越前面;
第六章 贝叶斯统计
哦,这里发现个及其严重的错误,在p180页,计算自己患蜥蜴流感的概率为多少,在文字公式中,应该是在实验结果为阳性的条件下患病概率,而不是为阴性的条件下患病概率;
一、基础概率:统计出总的概率情况;
二、条件概率:一件事发生为前提的另一件事的发生概率。
三、贝叶斯规则(用简单的整数思考复杂的概率)用基础概率和条件概率估计新的条件概率;
四、贝叶斯公式:
第七章 主观概率
将严谨融入直觉的简便办法;
网友评论