Endle 评语:不推荐
这本书的标题非常的令人激动,看到开头的序言更是令人热血沸腾:清洗数据,就像厨师要保证工作区清洁一样重要。不过,从第二章开始,期待一点点被失望取代。比如,第二章提到的编码知识虽然重要,但是在 Dive Into Python 3 - String 中,有着更为详细的论述。接下来列举的实例,也有些乏味。抓取电子邮件一章中讲到的技巧,我在实现 GGMM Generates Minutes Mail 的时候,对照 Python 手册,基本都能摸索出来。不谦虚地说,我觉得不比书中实例做得差。最期待的 PDF 部分,也只是浅浅地介绍了一下 Python 里 pdfMiner 库的使用,并且告诉你,如果没搞定,买一个 Adobe Acrobat,然后把数据复制出来,人工使用 Excel 一类的软件调整格式。书中范例是,从一个约150页的文档中摘取一个表格。如果需求是摘取每个表格呢?很遗憾,对于更有难度、也更有趣味的这部分内容,书中只字未提。
读完了整本书,我想不到,这本书的受众是谁。如果读者不会编程,那会看的一头雾水,我会推荐一本 Python 教程而不是《干净的数据》;如果有了一定编程基础,那用 Google, Stack Overflow 搜寻答案的效率,比阅读本书不知道高到哪里去了。
概括一下,《干净的数据》不是一本烂书,而是一本没什么收益的书。把读这本书的时间花在任何一本优秀的编程书上,都能获得远高于《干净的数据》所带来的收益,与乐趣。
这本书很薄。如果你依旧愿意尝试的话,可以点击购买链接。
网友评论