【精彩摘录】
大数据的精髓在于我们分析信息时代的三个转变,分别是,要全体不要抽样,要效率不要绝对精确,要相关不要因果,这些转变将改变我们理解和组建社会的方法。寻找因果关系是人类长久以来的习惯。相反,在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系,这会给我们提供新颖且有价值的观点。相关关系也许不能准确地告知我们某件事情为何发生,但是它会提醒我们这件事情正在发生。如果数百万条电子医疗记录显示橙汁和阿司匹林的特定组合可以治疗癌症,那么找出具体的药理机制就没有这种治疗方法本身来得重要。同样,只要我们知道什么时候是买机票的最佳时机,就算不知道机票价格疯狂变动的原因也无所谓了。大数据告诉我们“是什么”若不是“为什么”。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。
【我的思考】
作为一位专门忽悠客户的售前非专业人员,经常听到前辈们向客户提及“大数据技术”五个字,似乎隐约知道其大概用途,于是决定阅读此书争取对“大数据”有更深入明晰的了解。在这本书中,作者一直在强调大数据的本质,即作为一种工具告诉人们事物之间的相关关系并且对未来趋势做出预测。不得不说,这样一个观点鲜明的论调确实为许多学术思想中的“黑匣子问题”带来了一个新的思考角度。学术中的“黑匣子问题”指的是,在部分因果关系已然明确的理论中,科学家还无法对其由因至果的过程做出合理解释。而大数据技术,则是避开黑匣子,将关注的重点放在理论的实用性方面,不求因果关系,但求预测未来。这似乎与古人所强调的“知其然知其所以然”相违背。在写学术论文时,通常是由从调查或是数据库中取所需数据,通过统计分析的方法来判定A和B之间是有相关性关系的,然后作者通常会探究其中原因,并在文末就结论作出一系列相关性预测与其他可扩展研究的方向。由此可见,大数据之所谓寻找相关关系这一观点并不新颖,区别在于学术论文只用了抽样的数据,但凡全体数据可以收集到,专家学者又何必只采用抽样的数据呢?可见,文中作者所说的要全体样本有些不实际。
【我的行动】
最后回到工作上,通常我们为客户进行售前咨询时,遵循的是“产品是什么”“为何要采用我们的产品”“怎样使用可以带来更大效益”这样一个流程。前辈们都会在最后阶段提及,利用产品后台记录的数据,应用大数据技术来为学生提供个性化的辅导,例如推荐相关性的课程等,然而这些东西大家只是几句话带过。也许以后我可以更详细地和客户阐述一下大数据的理论,一方面和客户强调大数据的探求“相关性”的本质,比如后台会分析某道考试错题与其包含知识点的掌握程度之间的相关性,掌握程度又是通过统计量化的几道练习题的数据得到的,最终老师会在前台直接看到大多数学生没有掌握的知识点是哪一个,从而减少老师平常的统计分析工作量,直接得到结果;另一方面也会和客户阐述大数据技术和他最终使用产品得到效益之间的因果关系,从教育理论入手更好地说服客户。
网友评论