课程的第一模块,是感知数据,共有六讲。
昨天到现在,学习了本模块的后四讲。
一、如何去探索数据背后隐藏的信息?
数据本身并不会开口说话,不会告诉面对数据的你,它里面都包括了什么内容。那么,只能是依靠面对数据的人,对数据进行挖掘分析,以此来得到数据背后隐藏的秘密。
作者提到三个方法。数学推断,逻辑推理,切换角度。关于逻辑推理,作者特意指出一个自我训练提高的方式,就是多做数独题目。
巧了,这段时间,为了让儿子提高对数学的学习兴趣,给他买了几本数独方面的手册,由易到难进行练习。儿子没看多少,我倒是有时间了就翻翻,真的做了些训练。
其实,对数据的感知,是一个复杂过程,也绝非作者指出的那几个方面。要想提高自己这方面的能力,也绝不是朝夕就能实现的,只有从多方面入手,把数据思维当成自我提高的一个重要方面,才会在实践中不断进步。
二、不同的人对同样数据的感知是不一样的。
其实这一点非常好理解。人与人之间本来就有很大差异,同样是一个老师在教,成绩却会差的很远,这很常见。
最终一个人对数据的处理水平,就会体现出来,其中的差异,大概就是成就的差异吧。
针对这一点,作者提出对这个现象,既要看到其常见性,也要引起警惕。不要用自己对数据的认识来代替别人的。其实不仅仅在面对数据得出结论这件事上,在任何一个方面,也都要用人与人有差异这个事实,来警惕自己。
三、要敢于不精确。
这里最重要的一点,是数据的精确,是有代价的,并且有时代价会大到让人无法承受。
对这个理由,我有深刻的体会。在机械设计上,有一个重要的事情,就是配合尺寸的公差选择。比如轴与孔的配合,如果是一个手摇设备,孔的直径比轴大上个0.1甚至0.2毫米(仅仅是为了大致说明,这里没有考虑轴孔的基准尺寸)都无所谓,反正手摇速度,不可能太快,人的手还具备灵活的适应性,使用起来完全没问题。
要是用在自行车轱辘上,这个轴孔直径的间隙,就有点大了。就算一开始感觉不明显,时间一长,这个间隙引起的磨损也会非常严重,直接影响使用年限,很快就报废了。所以这时间隙就要控制到0.01到0.02毫米左右,才能保证自行车的正常使用。
其实,自行车跟自行车也不一样。市面上几百元一辆的那些,刚才提出的间隙是合理的,如果是几千元上万元的那种,间隙就更要小,有时几乎不能留有间隙,甚至让间隙是个负数,通过特殊手段进行装配才行。
为什么要有这样大的差异?核心因素就是经济性。生产任何零件,都不可能把尺寸做的一丝不差,只能是保持在某一个范围内,这个范围越小,代价越高,所以虽然是同样材料同样大小同样形状的一个零件,如果在尺寸限定范围上有较大差异,那么其价格,也将出现天差地远的情况。
作者提到美国正在生产的太空望远镜:
据报道,这个望远镜的镜面加工精度是10纳米,也就是几十个原子的宽度。到现在,这个项目已经花了100亿美元以上,最近消息说它将在2021年3月发射。
10纳米是什么概念?0.00001毫米!那么大的基准尺寸,要达到这样的加工精度,以我的知识,是理解不了的——先不说钱,就是加工方法,我也想不到。已经花了100亿美元以上,自有它的道理。
所以作者提出一个非常重要的概念:精度,是通过目的来确定的。
关于估算,我是赞成的,但是作者提出的两个说法,我有些疑惑。
一是估算的精度,作者说估算值与真实值的差异只要在真实值的十倍以内就可以。假如真实值是10,那么估算值如果是100,或者估算值是1,都符合这个要求,可是两个估算值的差异,那就不是十倍关系了。
当然,作者的核心意思,强调的是估算方法的正确性,超过估算值的准确性。同时也指出,只有不断学习,不断修正估算能力,才会让自己的估算水平,更接近真实值。
二,就是估算成本的付出,使用1%法则。比如评估一个需要用掉100个小时的工作值不值得去做,只需要用一个小时就可以,否则就有些不合算。这个1%,自己也是不太赞成的。
不过,我相信作者这么说,也绝不是让作为读者的我,机械的来学习与使用这些方法,所以,我提出这样的质疑,其实是多余的。
四、什么是数据?
这可是个大问题。学习数据思维课,如果连什么是数据都搞不清楚,还谈什么学习呢?
不过,实事求是的说,这个定义,还真不好下。
作者提出了映射理论,元数据概念,还有葡萄酒理论,要求一定要把数据、数据容器、数据所蕴含的信息区别开来。
为了说清楚,作者用葡萄酒做了生动的比喻。酒,就是那个数据,酒瓶,是数据容器,酒瓶上的标签,是元数据,而喝酒时体味品尝到的那些,才是数据蕴含的信息。
这些数据中蕴含什么信息,是数据使用者的创造,甚至可以说,是在数据使用者与数据之间的互动中出现的。
换句话说,数据仅仅是潜在的信息提供者,处于一种未经处理的原始状态。只有找到各种描写它们特征的办法,你才能让数据开口说话。
以上两段,作者特意用不同的颜色,不同的字体进行了敲黑板,也是作者要表达的重要思想。
实际上,这也再次提出了学习数据思维课的重要性。我们普通人,本来就缺乏对数据的敏感性,更缺乏理解数据,分析数据的能力。可是,数据思维是一个非常有效的方法论,在这方面进行提高,绝对有助于帮助自己提高解决实际问题的能力,所以,一定要加强数据思维方面的学习,以便自己在工作生活中,能更游刃有余。
更广泛的一点理解:所有的信息,其实都是广义的数据,如何透过现象看本质,才是所谓数据思维的真实目的。
网友评论