美文网首页大数据@IT·互联网
三分钟带你加深对大数据的认知

三分钟带你加深对大数据的认知

作者: 左远 | 来源:发表于2017-06-21 17:36 被阅读0次

    近期对大数据有了一些新的认知,这里给大家分享一下。

    1、大数据的特征:体量大、多维度、全面性、时效性和抽象意义上的大。

    big data之前学术界叫very large data,在英语的意思里面,big是抽象意义上的的大,而large是量的大,这就是很准确的解释了,big就是相对之前小的大,抽象意义上的大。

    所以大家不要从中文的字面来理解大数据就是很大很多的数据,大数据具备体量大、多维度、全面性、时效性和抽象意义上的大。

    注:美国互联网大数据平台(IDC)指出,互联网上的数据每年将增长50%以上,每2年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。

    2、在大数据时代要具备大数据思维,大数据思维的核心:从大量的数据中直接找到答案,即使不知道原因。

    传统思维要讲究因果关系,需要经历“假设-求证-再假设-再求证”这样一个漫长的过程来找因果关系的规律,找到规律的成本很高。

    有了大数据以后,直接从数据中去获得答案,从而避免了找规律的高成本,使得解决问题简单很多了。

    3、基于大数据思维,其实大数据就是用数据驱动方法来解决问题,而不是用统计学采样分析的来解决问题。因此需要对数据进行全量加工。

    全量加工需要对全量的大数据进行大规模计算才能解决问题,而计算能力的提升,也是促进大数据发展的主要原因之一。

    4、大数据针对的是全量数据,即交易数据和行为数据都要包括,而不是只针对交易数据。

    交易数据:业务流程中必须记录的数据,数据规模中等,一致性要求很高。比如在淘宝下单购买的记录。

    行为数据:业务流程中非必须记录的数据,数据规模巨大,一致性要求比较低。比如在淘宝浏览商品或者页面的记录。

    5、大数据将改变以往只是基本进行全部或者局部的信息统计的情况 ,而是通过设定好的规则机器自动运行分析能够精确到针对个体的行为和特征。

    不要觉得自己是个普通人,大数据分析就不会精准到自己,实际上程序都是自动运算的,能够具体分析到每一个个体。

    6、用户画像是建立在真实数据基础上的,核心工作就是根据用户行为数据结合算法或者数据挖掘给用户贴标签。结合大数据,会让用户画像更加精准。

    不同的应用场景下,用户画像是不同的,因此在大数据变现的时候,用户画像不是有一个用户把他画出来,而是有一个客户要什么样的人,然后把这些人找出来。

    7、数据不是越多越好,而是越有价值越好。数据价值:决策行为数据>主动行为数据>被动行为数据。

    有价值的数据才值得交易,并不是数据越多越好,而应该是越有价值越好。以网上购物为例:

    决策行为数据(用户已经产生决策):下单购买或者放入购物车

    主动行为数据(已产生目的但未形成决策):主动搜索商品或者主动点击商品广告

    被动行为数据(强加给用户的,一般是负面加权):推送的广告,如多次推送同样的广告用户不点击,那就是没兴趣

    用户ID(能够标识出用户)很重要,能将行为归到具体的人,具备用户ID的数据更有价值。

    同时能够利用社交关系的数据来弥补个人行为数据不足,比如你的朋友多数都喜欢足球而不是篮球,那么你有很大概率也喜欢足球

    8、大数据变现(交易)是依附在应用场景上,而数据是所有工作围绕的中心,是核心资产。

    不同的应用场景对应不同的需求,即同样的数据在不同的场景下价值不同,而随着时代的发展,数据将会成为最重要的资产,就如习总说的那样“谁掌握数据,谁掌握主动权”

    数据变现并不一定就是要卖数据才行,如果能通过数据转换为交易数据将会带来更大的收益。比如电商通过分析你的浏览记录来引导你购物带来的收益显然比卖个数据出去更大。

    另外需要注意的是,数据并不是卖的人越多就价值越高。

    9、数据管理平台DMP

    DMP :Data Management Platform,即数据管理平台。DMP是利用大数据技术从海量杂乱的数据中抽取出有价值信息的,DMP帮助广告主搞定大数据处理问题。

    目前市场上的DMP整体可以分为第一方DMP和第三方DMP。

    第一方DMP:是广告主的私有DMP,即自建DMP,收集整合的是广告主的第一方数据,包括广告数据、官网数据、EDM数据,CRM数据等,广告主拥有系统的唯一控制权和使用权。

    第三方DMP:控制权和使用权一般归DMP运营商所有,其中收集整合的数据不属于任何一个广告主独有,对于广告主来说属于第三方数据。

    目前在美国DMP相对已经比较成熟了,而国内并没有太强的DMP,随着互联网广告的大幅增长,这一块还是很有增长潜力的。

    10、各个平台之间的大数据会逐步从孤岛走向融合,融合后的大数据价值会更大。

    各个平台之间的数据并无互通,但是随着发展,逐步会通过合并或者合作来获取彼此之间的数据。

    单个平台的数据相对比较狭义,不同平台的数据融合,能够起到很好的互补,产生1+1>2的效应,细分到广告营销行业这也是DMP的最主要的作用。设想一下,如果有一天支付宝和微信的数据融合,产生的效果会不会很惊人?是不是能够把你完整的画像出来?这也就是为什么做社交的要做支付,而做支付的为什么还要做社交的原因了。

    11、大数据会让个人的隐私越来越少,请注意保护好自己的隐私。

    多维度的数据凑到一起能够得到一个人完整的画像,因此个人隐私会越来越少,数据足够大的时候,甚至会比你自己更了解自己。

    因此需要注意保护自己的隐私,需要特别注意的是隐私数据给陌生人并没太大恶性影响,反而是熟悉的人如果有恶意就很危险。

    相关文章

      网友评论

        本文标题:三分钟带你加深对大数据的认知

        本文链接:https://www.haomeiwen.com/subject/tnizqxtx.html