提起大数据想必大家不会陌生,同时又有很多问题!什么是大数据?大数据来自哪里?大数据有什么用?等等太多有趣的问题。
2018年,世界于个体都身处更庞大的互联网洪流,知乎在此开始全新一季互联网十问——『互联网洞见者』
第二问来自今日资本创始人徐新总裁,他的问题是:算法源于大数据,而大数据源于我们每个人,那我们是不是应该拥有主导数据的权利?
我对于这个问题的答案是否定?为什么呢?后面会提到!
先看一下什么是大数据
(百度搜素截图)
说简单点就是海量的资料!用网络爬虫技术对数据信息进行采集、提取、挖取、处理;那么这些资料从什么地方获取,又有什么用呢?
大概在12年左右大数据这个名词进入了大众的视野,到现在人尽皆知,而且已经在悄然的影响着我们的生活,你会发张现抖音短视频很懂你、淘宝知道你想买什么东西、今日头条的广告都是你感兴趣或者刚好需要的服务……
其实从前面徐新的提问中,我们就已经知道大数据源于我们每个人,什么意思呢?你每天使用的微信、百度搜索引擎、微博、网易云音乐、搜狗输入法……他们都在收集你的数据,补充完善着巨大的数据库。我们每个人的消费无非就是“衣食住行、吃喝玩乐”那么相对应的盈利点也就是提供“衣食住行、吃喝玩乐”所需要的服务,所以有了滴滴、美团、携程各种各样的app;我们来看看国内市值比较高的几大互联网公司:阿里巴巴、腾讯、百度、今日头条……他们提供了多样化的服务,聊天、搜索、实时新闻、游戏、移动支付、购物等等各种你想要的东西!他们在不遗余力的满足你的需求甚至你的心理。有没有人想过,他们为什么要这么做?
因为谁掌握着数据,就掌握着未来!“人工智能 、AI”好像是未来的代名词,299元的小爱同学,我在问他西安今天天气怎样,他回答38度高温,太热了不适宜出行!当我继续问他那怎么办?他说,没事拿出钱包看一下这下是不是好多了?我问他雷军有钱吗?他说我爸爸有没有钱管你什么事?一个299的人工智能他是怎样做到这一步呢?这背后其实是一个团队收集着每天全国超过3000w用户和小爱同学对话的数据,然后进行分析,可以说他只是从云数据里面选出比较符合逻辑的一个回答而已,他会思考吗?显然不会!没有几千万用户的使用,小爱可以称得上智能吗?肯定不行!
抖音,目前很火的短视频社区,月独立台数达到2500w台以上
(数据来源/艾瑞指数)
抖音延续了今日头条的算法,比方我们在看一个视频的时候他会把相关的标签罗列出来,以“丽江石榴哥”为例子,当你看石榴哥的视频时候,他会认为你喜欢这样的类型“石榴、幽默风趣、丽江、旅游、云南、男性、中年”等等,然后系统会给你推送同时尽可能拥有更多这些标签的作品,在从推荐里面根据你的点赞、评论、以及停留时间慢慢筛选出符合你的作品,这样就做到了精准推送!
随着电商的发展,网上开店的门槛可谓越来越低!亚马逊、京东、蘑菇街、苏宁易购以及后来者居上的拼多多这些所有的购物平台中做的最好的肯定还属于淘宝!用去年双十一数据来看,天猫、京东、苏宁易购当天的销售额分别为1682.70、543.75、110.22亿元 ;而且值的一提的是其中移动端支付占比达到90.00%,在这个数据中,淘宝引入的“千人千面”功能可以说功不可没,也就是字面意思,几乎所有人看到的淘宝界面都是不同的,强大的系统会根据你长期以来的消费习惯,消费能力以及近期的搜索数据推荐你喜欢的产品!比方你买了1000元的耐克鞋,那么他就会给你推荐同等价位的产品,比方说运动鞋或者篮球鞋或者相对应的运动裤或者篮球,以及衍生出来的自行车、户外用品、增肌粉……那么别的平台为什么不这么做呢?或者说也这样做了但没有这么好的效果,第一、肯定是阿里巴巴作为龙头产业占据着庞大的用户 第二、他们没有庞大的数据去分析用户的消费从而做到精准推送!
1936年《文学文摘》为了预测总统候选人先后寄出1000w份调查问卷,最后收到了惊人的240w份回执,这可谓是大数据吧!统计后的预测结果是 艾尔弗雷德.兰登将会以55:41的优势击败富兰克林.罗斯福赢得大选,但最后的实际结果呢?罗斯福以61:37的压倒性优势获胜!那么造成这种预算偏差的原因是什么呢?这里要提到一个“幸存者偏差”的概念,也就是样本误差和偏差!因为他们当时的调查是采用电话回访的形式,而且1936年大概是大萧条结束后不久,贫富差距较为严重,这时候能买的起电话的人不是大富就是大贵,但是总统选票却是全名参与,所以必然性的造成了预测数据与实际的巨大偏差!!!
就像你在火车站和飞机场两个地方调查人名幸福感指数、在三合市场和大商场调查中国人消费能力、春节期间在火车上调查人们有没有买到火车票……
在目前互联网发达的现在获得数据的成本越来越小,但是数据量是几何倍增加的!是马云做到了全民购物、所以他可以从自己的数据库中知道全国各大城市的消费特点、知道哪个城市人口流动性强、甚至亲口说个全国城市女性罩杯最小的是浙江省;雷军知道深夜里人们个小爱对话最多的话题;滴滴知道你的上下班规律;百度知道你感兴趣的话题、领悟;支付宝知道你的经济状况……
就在今天我感到了一个特别惊讶的事情,昨天我在携程上查了一下林芝-成都的机票,结果在今天看知乎的时候文章底下就有推送这样的广告
接下来我们回到徐新的问题,“大数据源于我们每个人,那么我们是不是应该拥有主导数据的权利”很多人对于这个问题觉得是互联网公司侵犯了我们的隐私,知道了我们一些难以启齿的秘密!但是大数据,重点在去“大、全”其实我们一个人的行为习惯,数据统计根本说明不了任何问题!而是千千万万个我们共同组成的,我们个人也很难用这些数据做一些事情,如果不是大数据就没有现在的人工智能,你也很可能错过近期的特价机票、不知道你感兴趣的行业所发生的最新改变、淘宝买一件东西要在几万十几万的商品中筛选……
试想一下2023年的某天早晨你去一个陌生的城市出差,刚下飞机某个app给你推送附近可用的专车、根据你的消费能力推荐最合适的酒店、当你住下后刚好十二点siri告诉你附近有一个你老家的餐厅、在你想带点土特产回去的时候他告诉你附近的步行街……
当法拉第把人类第一台发电机展示给他的一个朋友,当时的税务官格拉道斯通的时候,他不解的问道:“花这么大力气,即使成功了,又有什么用?”法拉第回答说:“好吧,我也不知道有什么用,不过我我相信不久你就会问他收税了”我们可以大胆猜想一下“大数据”对我们未来生活的改变!
突然又想到知乎十问中第一问,马化腾的提问“未来十年,哪些基础科学会影响互联网融合创新”那么要不是法拉第,我们是不是不会拥有现在日新月异的生活和发达的互联网即使有可能也要推迟几十年?
网友评论