我是在读研究生,必须要写论文。而写论文之前要找到要写的点,idea。
正规的模式是,阅读大量文献,肚子里有墨水了,从中找到论文不足,或者论文没考虑到的地方,然后从此入手写论文。
另一种模式是来源于数据,来源于现象。发现现象出乎你意料,所谓存在即是合理,你要透过现象找到合理性的原因。
对大多数来说,选题目似乎很简单,使用第二种模式,在现实世界找就可以啊。而大数据方法也算是这一模式。
通过大量的繁杂的信息,分析出有趣的两两关系,然后研究为什么会出现这一关系。很著名的沃尔玛“尿布与啤酒”案例(没记错的话,应该是上个世纪发现世界杯期间,沃尔玛超市中这两种产品销量存在很强的正相关),最后分析出,世界杯期间,当爹的男子为了看球赛,需要出去买啤酒,顺带着给自己的婴儿买尿不湿,因此两者存在很强的正相关。
我也是觉得大数据方法真的很神奇,才开始学数据科学。不过我很low B的,目前只是会数据采集,结果数据采集回来了,才发现还要分析数据,从中找新idea新关系。而大数据分析起来比较难,还需要继续学习贝叶斯,机器学习,文本挖掘等等。
只是为了找idea,结果我现在学python编程、数据分析半年多了。而正规军模式,大量看论文的,已经找到选题的方向,开始写了。
我呢,即使现在有选题方向,苦于没有墨水,还要回头继续看论文,写综述,写文章。
所以,我强调,方法还是要学习的,不过大数据方法只是方法。关键是想法,有了想法,有了思路,如果你再有方法,那才是如虎添翼。
网友评论