数据结构
大数据是杂乱的大数据,过程随意,经常漏洞百出、残缺不全。另外,构成大数据的各个小数据集都有自己的特性。
研究方法
通常科学家们将数据证实某种假设,并行成一个数学理论。大数据探索有时候会被称为“无假设研究”,即人们永远不知道能够从数据中知道什么。过去是科学是因果关系的探索,例如爱因斯坦的相对论,大数据更多的是相关性的探索,例如研究温度上升和海盗数量的关系。因果关系是科学研究的核心意义,当我们有数百个发现而不能解释时,发现就变成了只是为了发现而发现。
数据的产生和存储
在大数据的世界里,大型企业甚至政府拥有最大规模的数据集,他们更关注企业的收入和利润而不是共享数据。学者和科学家在共享问题上也是如此。
法律问题
学者和科学家为了得到数据,开始不断地接触工程师、产品经理甚至高级主管,但最后的结果都免不了律师的介入。
网友评论