“对于善于运用科技解读未来的人来说,我们的未来不再是只字未书的画布,而是似乎已经着上了淡淡的墨痕”。
好久不读书,也好久不写读后感。上班后,自我感觉变懒了好多。
也好久没有读过纸质书,上次读书也不知道是什么时候了,好像是19年寒假的事情。
但是这个寒假还不错,至少已经读完了两本书多。
1
出版方是湛庐文化,很有名,“与最聪明的人共同进化”。但是已经记不起我上一次读他们的书是哪一本了。
这个书还是挺有名的,豆瓣得分7.5,那基本上证明了7.5以上的书显然是值得一读的。
这个书截止到我买的这版已经印刷了26次了,说明是畅销书无疑。
作者一个是牛津大学教授,一个是经济学人编辑,都是厉害的人。
而译者之二周涛,我在数学建模的时候就在网上无意间搜到过他,没想到已经这么厉害了。
书的英文名是 big data: a revolution that transforms how we live,work and think.
翻译成了 大数据时代,一场生活、工作与思维的大变革。
![](https://img.haomeiwen.com/i1491506/43fc3fc1727b359e.jpg)
2
因为好久都没读过纸质书了,读起来很慢,还容易走神。
为了不走神,这次我采取了很多使自己专注的方式,都很有用一一记录下来。
A.用铅笔在书上勾勾画画。
还挺有效的,我试试我自己二刷的时候能不能还想起来那些星星点点的思绪片段。
B.番茄钟
适合一个人爱走神、爱玩手机的时候使用。
C.找段落中心句
我想起自己在考雅思阅读的时候,手足无措,老觉得看不懂。看完这书我明白了,我连中文都看不懂,我还能指望自己能很快看懂英文吗,真的,读书读得太少了,连基本展开方式都不清楚。我通过分析每段中心句的方式,成功地防止了自己的走神,而且让自己明白了这稍显晦涩的中文都表达了啥意思。
D.在mubu中做笔记
我在mubu中做了所有思维导图笔记并且把它投到了Mubu精选,我感觉每次整理过一遍后就对这个书就更有透彻的了解。前一阵读完的《马克思靠谱》也重新整理了一遍,现在脑子里还是很有印象。
读书为啥会走神?我感觉——
一个原因是有的书就像教科书那样,知识点太多,而且都是新的,这样你就不好懂。
还有就是个别词是新的,你不明白,比如“动因”这个词我就不太明白,查了下是行动和原因,但是我还是想知道英文到底是啥,有的时候看中文看不懂。
另外就是你不知道书要怎么展开,不清楚它的逻辑,这样你被牵着走的时候就很费劲,明白中心句了以后即使个别段落你看不懂你也能明白到底是啥意思。
这次读书,我深深体会到了自己阅读量的欠缺,这个寒假的确不能在看电视中度过了,得读点书,即使晦涩读不下去也要坚持。
那么,如何得出了还是得读书的结论?
A.这书是2013年流行的,我2020才看,真的是思想就比人落后七年。
B.最近看韩剧《stove league》,然后我发现这里面的梗其实是来源于《点球成金》《魔球:逆境中致胜的智慧》,我甚至觉得编剧是读了大数据这本书然后才想到这个剧本创作...可以看到,很多我觉得新鲜的事情其实早就不再新鲜。
C.这本书即使就像网友们说的废话略多,它里面仍有很多鲜活的实例,从一个东西的历史写到现实,说明做了很多功课,你也知道了如果让你写书你来怎么写怎么扩充语言的方法,所以我感觉读书还是很有好处的。
里面的实例超级多,让我觉得如果让我来做课件给大家讲大数据,随便找几个例子给大家讲讲大家就能明白了。
3
读书还是能颠覆人的思想的。它提升了我的认识。
比如,尽管大家现在都知道大数据是什么了,但是我读完书仍然很有收获,也对这个东西认识得更深刻,纠正了我之前认为的一些不太对的地方,现在走在路上可以拍拍胸脯说自己真的知道大数据是什么了,这是很不一样的。
另外就是也不必人云亦云。豆瓣7.5的评分,不高,大家都说说书太重复了,谁不知道大数据是什么啊,还写这么多,怎么说呢我感觉这就是一种浮躁的表现。对于我这种带着问题来读书的,我觉得作者写这么长挺好的。
一千个读者就有一千个哈姆雷特,不同的人眼里的认识是不一样的,而且也没必要跟其他人的认识是一样的。
这本书例子很多,而且很新,作者是个狠人。
对于一个想利用大数据搞科研的人而言,它的确解答了我自己的很多疑问——
A.大数据从哪来?
各种地方,手机,位置,文字,沟通,都是数据……个人信息可以是被手机、pc、各类账号记录后出卖的,可以是传感器测的,可以是你填验证码时提供的,也可以是有人有意收集的。
所以我也在学爬虫,爬网页爬图片爬文字爬视频,万物皆可爬。
B.大数据有什么价值?怎么利用数据来解决人们的问题使人民生活得更好?
文中上百个例子讲明了各类数据的价值,总之就是非常有价值。
但大数据有没有价值取决于你会不会处理数据,你有没有注意到它的潜在价值,你有没有一颗创新的小脑瓜。
通过一系列大数据处理方法,谷歌翻译更准了,高德地图更灵了,亚马逊推荐更贼了……总之大数据为你带来的益处让你拍手叫好啧啧称赞。
C底什么数据可以被我们使用,使用隐私数据是否侵犯人的隐私?
我不知道标准回答是怎样的,此处我也不想知乎,我谈一下看完这本书后我的理解。
首先,只要是公开的、没有什么版权的就可以使用(非商用使用肯定是没问题)。
而隐私数据是否侵犯他人隐私?以爬取微博为例,过去我们认为,我们发微博的时候其实是跟微博签订了个人隐私合同了,我们看也不看地点了小对勾,所以微博把我们的想法发出去不算我们侵犯隐私,我们爬取公开的微博,我认为也不算侵犯隐私。
但是,这本书第八章管理规范说,我们不能把责任全都推到用户身上,我们需要让数据使用者买单,所以数据使用者也不是一点风险都没有的。
例如,我们通过分析某个人的1000条微博,知道了他的各种喜好位置信息女友风格等等等等,最后精确地把他定位了,那其实就有点侵犯的意思了。
另外就是还得看我们使用数据的目的,如果是一些不法的目的,例如发一些诈骗信息什么的,那我觉得肯定是损害了社会秩序的。
当然,我认为本书也有未能解答的问题,那就是大数据技术、算法方面的问题。讲了那么多东西,没讲关键点——我们需要了解大数据技术!不知道技术我咋赚钱咋搞科研?技术是机密,技术很精深,技术的专业性更强,他们也不好讲,一本书也讲不完,所以我也理解此处有所省略。
总之本书还是一本很好的书。它不是一本很好读下去的快餐小说,它是干货满满、带你打开新世界大门的那种书。
我们还要坚持读书,开卷有益。
4
这本书的脉络大概是这样的:
先讲大数据的三个特点:全体而非抽样、更杂而非精确,以及体现相关关系而非因果(Chp1-3)。
然后介绍了大数据的在商业上的一些应用、产生的一些变革。
万事万物都可以数据化(Chp4),大数据的价值在于它的潜在价值(二次利用/交叉复用)(Chp5),想要发展大数据必须重视数据、技术和思维,也分别介绍了三种公司的特点(Chp6)。
最后,大数据时代,管理也要改善,考虑到大数据可能产生的一些问题,我们需要在4个方面进行管理变革以更好适应大数据时代(Chp7-8)。
前面大数据的三个特点我们其实都已经很清楚,全体数据而非抽样数据、杂乱的数据而非精确的数据,相关关系体现得更多。就第三方面而言,译者周涛有不同的意见,周涛不认为相关关系比因果更重要,说因为这不是观念上主观认为的,而是机器学习黑匣子方法造成的。作为比机器高的智力存在,我们必须要追求因果,说得也不无道理。作者其实也在第八章讲了,不能全靠数据,人的灵感也是非常重要的存在。
大数据的出现还是很好的。我们过去文科做各种实验都是要抽样,要做问卷,但是其实数据跟填写人的素质有很大的关系,说实话我觉得做问卷都不是特别科学,还特别容易录入问卷的时候重复录入了。
但是现在有了大数据的方法,就挺好的,不用抽样,真实数据,海量数据,只要会处理,就一定对我们的研究领域有益。
第二个part其实是在讲大数据是怎么被利用起来的。首先是怎么产生(怎么数据化),文章讲了万物都可以数据化并且讲了文字、方位、沟通等等数据化后怎么处理这类数据。那么,咱们这些大数据到底怎么用?我的起居记录、微信运动数据、聊天数据、位置数据有什么用?第五章讲了,数据的价值在于交叉复用,通过一系列的例子讲了怎么利用数据。这一块其实也为我的科研提供了一些思路,虽然说商用的思路很难复制,我也没那技术,但是你看数据必须结合起来,必须得挖掘以后才好用,这就是如何利用数据。想好好利用数据,得有技术,得有思维,还得有数据,真是缺一不可。
第三个part是大数据带来的一些挑战,以及如何规避这些风险问题。这章给了我耳目一新的感觉,我以前从来没有想过这些问题。这些措施都非常可行也非常具有前沿性,也解答了关于我心中关于侵犯隐私的问题。
书的结语又总结了前三个部分的内容,然后再次明确了大数据的主要应用领域:分析和预测。
然后作者抛出了我这本书最喜欢的一句话:
“对于善于运用科技解读未来的人来说,我们的未来不再是只字未书的画布,而是似乎已经着上了淡淡的墨痕”。
5
最近,肺炎流行,大家通过微博朋友圈来了解疫情的最新走势变化。可以看到,物流领域、生产领域、医学领域都非常需要较为成熟的大数据技术,让我们的医疗技术更先进,居住环境更安全,日常生活更幸福。我们也同时希望微博能少一些删帖,朋友圈能少一些屏蔽,我们无比希望能生活在一个更加透明、更加公开的社会。
本书作者呼吁了大数据需要更加开放才能更好地被我们所复用,美国的data.gov等数据网站无疑向我们展示了美帝的胸怀和他们的政府治理能力。作为一个中国人,我更加深刻地体会到了提升治理能力现代化的必要性,而我也一直坚信,我们的祖国在为创造一个更加美好的明天而努力。
小青菜
2020.2.9
网友评论