这是一个信息过度丰富的大数据的时代。有大量的免费公共数据在我们身边。由于过去这些数据获得并不是很容易,比较零散,所以我们长期未意识到这些数据的应用价值。但当互联网的出现,数据爆炸式的呈现在我们面前时,我们的大脑本能的喜欢选择简单模式,选择视而不见的过滤模式。其实我们日常也不自觉的应用了很多大数据,比如淘宝会看购买量排名,看新闻会看下载次数浏览次数较多的。但我们主动分析的比较少。
我的思维模式比较笨拙,在读书期间就有干了很多愚笨的地毯式操作,但也消除了对大量数据的恐惧,造就了对大量数据的搜集和一点点数据应用的经验。也许就是这么一点点的差别,导致我越走越远。
终于在某一天突然产生了特别的想法。那天我看到一份省级的获奖名单,我突发奇想用省级的获奖名单来分析省内的行业格局。然后就慢慢延展开来,我收集一些类似的历史数据来分析一些事情。比如用行业内的评优数据来分析行业的格局,用获奖名单来分析如何更容易获奖,用大量的公示项目来分析项目选题,用招投标数据来判断行业趋势。
其实每个大数据应用都有一个或几个底层的假设作为理论支持。如果没有这样的假设,对数据的应用就没有了灵魂。比如淘宝上商品购买量大小是性价比的映射,新闻和视频点击量大小是群体喜好的映射,省级的获奖名单背后是企业综合实力的映射,项目名单背后是政策的扶持力度差异或者社会喜好的映射,招投标数据背后是与政府投资力度和方向的映射。
比较遗憾的是,我的数据收集能力还比较有限,数据分析能力也比较有限,眼界也有限。我的数据收集功能还停留在手工阶段,未能使用自动化的工具。我的数据分析能力也停留在Excel的阶段,没有专业化软件分析阶段。我的眼界还停留在企业员工的层面,没有进入研究者或者应用分析员的阶段。
网友评论