1
对于“数据究竟是什么"这个问题,我们可以从三个方面来理解:
1,数据是对现实世界实体的映射,是在某种方法之下对实体的数字化表达。
2,数据需要元数据来说明、描写和记录它的关键特征。
3,不要把数据容器和数据本身混淆,也不要以为数据自动蕴含信息。数据中蕴含什么信息,需要有数据思维的人专门处理。
2
1,对数据精度的过分迷恋是一件要警惕的事情。根据目标确定需要什么精度的数据,才是好的数据思维。
2,估算能让我们在知道很少信息的情况下得出相对靠谱的数据。估算时要做到两点一一敢于不精确,但不能太离谱。
3,"二八法则”和"1%法则"是两个非常好用的估算技巧。
3
如何通过练习提高自己对数据的敏感度呢?教你三个方法
一,量转型。思考、谈论和使用一个东西时,有意识地把过去定性的方式转变为定量的方式。
二,量定义。如果一个事物的性质是用某一方面的量来定义的,就搞清楚它具体是怎么定义的。
三,对应值。在量定义的基础上,为事物确定一个明确的量的标准。
4
1,背景不同,数据代表的意义就不同。只有确定了数据的背景,才能准确理解数据的意义。
2,掌握数据的背景可以帮助我们理解什么信息呢?
第一,理解事物的属性;
第二,理解事物的相对情况;
第三,理解当事人的意图。
5
单一的一个数据包含的信息也不是那么少,我们需要把隐含的信息挖掘出来。教你三个方法
1,数学推断。先利用数学知识做出假议,然后进行推断。
2,逻辑推理。从各个领域的规则和限制条件出发,进行合理化推测。
3.切换视角。在不同的视角、关系下观察数据,数据就会发出不同的隐含信息。
6
1,如果从人这一端来看,人的生物性和人与人之间的差异会导致我们在面对同样的数据时,产生不同的感觉、解释和观点。
2,人与人的差异主要包含三个方面一,生理倾向差异;二,文化属性差异;三,价值立场差异。
3,由于人自身的差异而导致对数据感知的差异,既是正常的,也是要警惕的。一定不要把自己的特点当成全人类的特点,大家对数据的感知可能真的不太一样。
7
1,对数据精度的过分迷恋是一件要警惕的事情。根据目标确定需要什么精度的数据,才是好的数据思维。
2,估算能让我们在知道很少信息的情况下得出相对靠谱的数据。估算时要做到两点——敢于不精确,但不能大离谱。
3,"二八法则”和"1%法则"是两个非常好用的估算技巧。
8
1,数据、变量和表格是三个不同层次的概念。数据是一个变量的具体值,变量代表一个维度的信息,表格是各种维度信息的集合。
2,数据一共有四种类型,分别是类别数据、次序数据、间隔数据和比例数据,分别对应唐僧、沙和尚、猪八戒和孙悟空。
3,数据类型不同,处理数据的方法就不同。
9
1,测量的目标就是为了得到一组指标。这样一来,我们就可以用这组指标描述一个事物了。
2,为了全面把握一个事物,测量时可以用维度拆分的方法,具体要遵循两个原则一边际效应最大化原则和可靠性原则。
3,为了保证测量的就是我们想测量的,我们需要用各种方法进行确认,考虑关联、结构和完备性是三个常用的方法。
10
1,只有概率样本才能确保全面反映总体的情况。
2,现实工作中,非概率样本也可以帮我们应对一些复杂的、概率样本难以覆盖的情况。
3,抽样调查的结果是一个有限制条件的范围,而不是一个单一的数值。
11
1,问卷的核心是提问,而不是问题出现在哪种媒介和哪个场景中。
2,问卷的含金量在于概念的操作化,也只有操作化才能打败操作化。
3,设计问卷时,问题必须让答题者准确理解,而且要注意提问方式。你得到什么取决于你怎么问。
12
1,实验法是通过操纵自变量、控制无关变量、观测因变量这样的逻辑,既找到了因果性,也能知道原因的效果大小。
2,实验法特别适合范围有限、界定明确的概念和假设。因此,实验法最大的问题就在于结论的外推,一不小心就会把结论的适用范围错误地扩大。
3,走出实验室做实验,让实验控制与真实的社会生活接近,会让实验的结论更可靠。
13
1,大数据带来了新的思维方式和利用方式,不仅冲击了传统的数据收集方式,也极大地拓展了我们的能力,我们必须与时俱进。
2,大数据拥有海量性、持续性和不反应性等优势,但使用时也有很多要避开的坑。
3,善于把大数据和小数据相结合,才是我们利用数据的最高境界。
14
1,寻找表征之前必须先真正理解问题,并反思你的认知。这样才能发挥数据技能的效力。
2,在面对复杂问题时,我们需要随着信息的增加而不断调整表征方向。
3,当没有现成的数据能表征我们想要的东西时,可以自己构造新指标。虽然有风险,但值得尝试。
15
1,分类就是按照量的标准把一个总体分成几组,必须保证组内差异小,组间差异大。
2,分类的结果一定是概率性的,有出错的可能。
3,当没有标准答案,仅仅能通过分析数据来分类时,最重要的就是建立数据与现实世界的连接。只有这样,才能确保我们的发现是合情合理的。
16
1,所谓的分解,就是把影响一个复杂事物的各种复杂纠缠的因素分开。通过分解,可以浓缩信息探究本质。
2,要建立分解的意识,不要一见到差异,就想当然地认为都源于一个单一因素。
3,分解的办法有很多种,因子分解只是其中的一种。每种分解方法都有各自的优点、缺点和适用条件。如果不确定你要解决的问题应该用哪种方法,可以找数据专家咨询。
17
1,两个变量之间因果关系成立的必要条件有三个:一,两个变量有相关;二,两个变量有先后;三,两个变量的关系不能被第三个变量解释。
2,因果关系的寻找是一项重大挑战,没有保证成功的一般法则。其中,最大的困难就在于反事实难题的存在。
3,面对现实问题,我们能做的就是猜测、验证和迭代。如果对因果关系的追寻有一个总原则的话,那就是保持谦卑。
18
1,真正利用数据指导决策,需要做好三步:理解挑战,建立模型,量化变量。
2,建立决策模型时要学会转换思路,从解决一个问题转换成理解一个机制。只有彻底理解了挑战背后的机制,建立的模型才是可靠的。
3,一切事物皆可量化,而量化的实质就是降低不确定性。
19
1,数据可视化是基于数据的,由数据驱动生成的图像,帮助受众看见并理解数据当中隐含的信息。
2,好的数据可视化作品要兼顾高效和美观。传达信息快速有力,过程又充满愉悦感和美感。
3,数据可视化是一个重要的探索工具,能让我们发现其他手段难以发现的新信息。
20
1,数字不会欺骗,是人会欺骗。西方有句俗语说,Don't hate the player,hate the game(别去恨玩家,要恨恨游戏).
2,误导的具体方法很多,不可能完全举例说明,建议你发现一个就记下来一个,经验多了,就会提高识别的能力和速度。
3,遇到别人用数据得出的论断,建议先问自己五问题:谁说的?他是如何知道的?遗漏了什么?是否有人偷换了概念?这个资料有意义吗?
21
我认为数据思维是现代人的基本素养之一,地位与语文素养一样。理由有三
第一,这个世界是量的,只有通过量オ可能接近质;
第二,只有通过量的竞争,才能达成质的暂时共识;
第三,虽然定量的方法不完美,但我们只能依赖它。
网友评论