07182020 《数据思维》第269/500本【旭哥佳庆方舟阅读好每一天】
一、朴素的数据价值观
1.数据的价值a.什么是数据
凡是可以被电子化记录的都是数据。
b.数据有什么用。数据之于个人的价值,一定关乎自身业务的核心诉求。
从收入、支出、风险三方面看待这个问题:
收入。最典型的是百度付费搜索广告,它通过对用户搜索数据的深入分析,进行精准匹配,为广告主带去一大波流量,它所创造的收入增长就是数据的价值。
支出。根据物联网技术采集到的信息,这也是数据分析带来的价值。
风险。很多商业银行都有网上申请系统,风险普遍高于线下面签。数据分析可以帮助它们更加准确地区分哪些线上申请者是好人,哪些是坏人。降低商业风险
2.什么是数据思维
以道驭术,以术驱道。在“道”的层面上,回归分析是一种思维方式,在它的指导下,我们可以把“业务问题”定义成“数据可分析问题”。而在“术”的层面,回归分析又是一种可以运用的数据分析工具,
因变量Y:因为别人的改变而改变的变量,这是业务的核心诉求。
自变量X:用来解释因变量Y的相关变量,通俗点说,自变量X的改变,影响了因变量Y的变化。X表现了数据分析者对业务的洞见。
二、大数据到底是什么
1.大数据和统计学的关系
大数据和统计学至少有两方面的关系:
a.统计学关注的核心,是对数据的分析建模,并通过建模对业务不确定性的刻画,这对大数据的贡献巨大。
b.大数据并不能代替抽样,相反,越是大数据抽样越重要。
2.大数据的准确度如何“预测不准是常态,预测准确是变态。”王教授这句话,戳破了许多人对预测抱有的美好期待。统计学研究中包括了大量的相关关系,其中只有极小一部分非常稀有的因果关系,但是因果关系的重要性依旧无法取代。
相关关系:客观现象存在的一种非确定的相互依存关系。例公鸡叫,太阳升起来。
因果关系:第一个事件(因)和第二个事件(果)之间的作用关系,其中后一事件被认为是前一事件的结果。
三、人人应有数据思维
1.提高沟通效率
不仅需要专业人士摆脱自己知识的诅咒,也需要需求部门克服对于数据的恐惧感,公司内部自上而下都有必要培养数据思维。
2.抓住商业机会
具备数据思维,能帮助创业者抓住商业机会,但这需要经过以下三个步骤:
a.我所在的创业方向,数据是否能帮助我?
b.如果数据很重要,将业务中的因变量Y和自变量X梳理清楚。
c.在战略层面上,保证Y和X的高质量供给、长时间积累。
3.生活中的数据思维 首先,培养数据思维帮你养成一种思考有的放矢的习惯:分析的目的是什么?核心诉求是什么?因变量Y是什么?其次,搞清楚目的后,你就能将注意力聚焦在相关的自变量X上,就不会陷入“放眼望去都是重点”的迷乱状态中。最后,你可以尝试最简单的分析,区分一下哪些是相关关系、哪些是因果关系。
四、各种数据分析方法
1.回归分析。 在“术”的层面就是各种各样的统计学模型。五种类型:线性回归、0-1回归、定序回归、计数回归以及生存回归。
线性回归,更严格地说是普通线性回归,其主要特征是:因变量Y必须是连续型数据,而对解释性变量X没有太多要求。在数据世界中,线性回归可以应用于股票投资、客户终身价值、医疗健康等领域。
0-1回归就是因变量Y是0-1型数据(只有两个可能取值)的回归分析模型。例如,性别只有“男”或“女”。
定序回归就是因变量Y为定序数据(关乎顺序的数据)的回归分析定序回归常见的应用场景有:电影的打分评级(1~5星);电商产品的满意度评分(1~5星)等。
计数回归。如果因变量Y是一个计数数据(非负整数,对应的回归分析模型就是计数回归。计数回归应用于:客户关系管理的RFM模型即一定时间内客户到访的次数
生存数据回归即因变量Y为生存数据(刻画一个现象或个体存续生存了多久)的回归分析模型
2.数据可视化。方法是统计图,而一张好的统计图应该满足四个标准:准确、有效、简洁、美观。常见的统计图有:柱状图、堆积柱状图、饼图、直方图、折线图、散点图、箱线图、茎叶图等。
3.机器学习。代表着一大类优秀的数据模型分析方法,是立志成为数据科学家的书友们的必修课。它主要涉及的方法有:朴素贝叶斯、决策树(含随机森林)、神经网络(含深度学习)、K均值聚类。
4.非结构化数据
数据是结构化的还是非结构化的,这是一个相对的、主观的概念。当然,其中也有一些达成了共识,公认的非结构化数据包括中文文本、数据结构、图像等。
结语:数据思维不仅仅是创始人一个人的事,是公司从上到下所有人都应该具备的一种基础的素养
网友评论