美文网首页
大数据时代读书笔记(2)

大数据时代读书笔记(2)

作者: XJasmine | 来源:发表于2017-11-23 16:51 被阅读0次

    大数据时代的到来逐渐将数据批量化。少量的数据可以通过控制它的精确度以保证最终结果的可靠性与一致性,因为“任意一个数据点的测量情况都对结果至关重要”。但是当数据量大幅增加后,过多的数据使我们很难保证它的精确性。于研究而言,精准的数据是得出正确结论的保证。但是正如概率论中的outliers一样,biases不仅不会影响大局,反而引领我们发现“存在即合理”之处,对错误的包容会给我们带来更多的好处。大概正如,后人研究明清时期的青花瓷却发现是民国时期的赝品,虽说数据出现了偏差,却弄巧成拙地发现了民国时期的仿制水平。存在偏差的数据让我们看到了过程中的变化,它们就是那些“突变的基因”,这不是错误,而是另一种可能。

    大数据时代读书笔记(2)

    混杂性是一种“百花齐放,百家争鸣”,很多事物是没有对错之分的,各种各样的数据使得结果更加丰富,同时也为即时性要求高的领域带来了极大的便捷。精确性的设定反而会束缚人们的创造,导致检索出来资源的匮乏。

    大数据时代读书笔记(2)

    承载了混杂数据的翻译软件可以翻译得越来越标准化和人性化,不过我们不得不承认,即使在大数据时代的今天,很多寄予丰沛情感的作品仍然只能依靠优秀的翻译家来翻译,这是数据与机器永远代替不了人的地方。同样不可否认的是,当我们需要的是一种大体趋势时,混杂性能够完美迎合。但是当面对精确性要求高的科学研究时,我们就不能利用大数据的这一套了,就必须做到精准。否则偏差一点就会让结果大相径庭,引发大灾难。

    相关文章

      网友评论

          本文标题:大数据时代读书笔记(2)

          本文链接:https://www.haomeiwen.com/subject/uonzvxtx.html