# 数据分析现状
数据分析作为统计学利用归纳法,将现实中已经发生的时间,通过整理归类,用以总结、探索、验证等方面。大量杂乱的数据历经收集、清洗、分析得以描述特征、寻觅隐含规律、证实证伪曾有结论。在大趋势上数据分析成为技术进步的关键生产力,也被形容成为“互联网时代的金矿”等待大家挖掘开采。
大趋势我们相信随着数据越来越多的积累,各种方式方法的提炼应用,各大公司越来越了解我们个人,任何小众的需求都被满足,每个人都会个性化的发展。
但是现在可能不是这样的,有一股逆流暗潮涌动,以前我们对‘推荐引擎’抱有很大期望,认为AI跟了解我们自己,可是得到各个网站的推荐我们是否更好了呢?
除了技术进步带来的生活品质提升、生产改良进步之外,硬币的反面也暴露展现。
# 第一个问题:很难通过数据分析找到人的个性需求
## 收集数据容易、分析数据难
我们很多人喜欢下载电影、电子书,一个系列必须齐全。当完全收集好的时候,得到了满足,但是大多数都没有看。
现在打开一个网页内容容量方面没有太多变化,但是开启速度却满了许多,可能是广告增加,但大多数却是被加载了很多追踪器。我们的一举一动都被记录下来。原则上人工智能可以通过分析数据后生成人物画像,之后向我们投放广告等。但事实上并没那么厉害,数据公司收集到的是特定环境下的行动,只能分析一个角度。收集是一回事,分析是另一回事。
## 点击行为常常不是你的个性
打开一个新闻网站,明星八卦跃然眼前,本能的一点击。这能说明什么?你是一个关心八卦的时尚青年吗?无论真实情况是什么,数据公司会记录为正反馈。它再次推送你再次点击,几个回合,你就被定义为“时尚青年”了。其实,你真的是吗?
再比如“星座预测”、‘人性测试’,将我们视线聚焦,然后总结。数次之后形成了标签。符合心理学上的‘巴纳姆效应’加‘自证预言’。完后你果然成为‘时尚青年’
>巴纳姆效应——每个人都会很容易相信一个笼统的、一般性的人格描述特别适合他。即使这种描述十分空洞,仍然认为反映了自己的人格面貌,哪怕自己根本不是这种人。
>自证预言——人会不自觉的按已知的预言来行事,最终令预言发生。
每个人所谓的个性,被淹没在众人的共性之中。
# 第二个问题:消费者的个性对商家其实并不重要
想买“扫地机器人”的时候,在搜索引擎里打入关键字,得到推荐。这个过程中用到‘个性化信息’了吗?关注公众号得到文章推荐用到‘个性化信息’了吗?购买电脑是,网站推送键盘鼠标用到‘个性化信息’了吗?都没有。
根本原因在于,我们很多人这的没有什么本质区别,而且广告和推荐不需要太精准。网上“喜欢A的人也对B感兴趣”的推荐已经是巨大的进步了。
更精确的投放,也去在技术上能做到,但是根本不值得去做。
大多数人的偏好都差不多,搞定制服务还有必要吗?
# 第三个问题:个性化定制的必要性降低了
Netflix(奈飞)以前有很好的个性化推荐服务。DVD时代,给看过的电影打分,接下来它会想你推荐你可能喜欢的电影,而且推荐常常令人感到惊喜,但是现在Netflix并不使用推荐算法了。因为精确已经没有商业价值了,以前邮寄光盘,要设法确保有你喜欢的,而现在网上直接看,不喜欢马上可以更换。看人们电影的人越多,更容易安排流量。从顾客喜好决定迁移到公司导向决定。
那么在这种情况下,公司角度还有必要生产小众节目吗,这是一个问题。
以前没有数据分析,创作者还可以根据个人喜好人以探索。而现在有了数据分析,用数据说话的声音越来越强,你就得越来越听数据的。
正如前述:数据分析基本相当于‘人性测试’——你越测试就觉得人性越黑暗,但殊不知黑暗本来就是你给测出来的。
总之,数据作用下人们越来越一模一样。数据最擅长的是过去的规律、大多数人的规律、特别是大多数人轻易表现出来的‘本能’。数据不会告诉我们创新,不会告诉我们内涵。“数据是深度愚蠢的”我们对数据的赞美可能是个神话,这个神话可能是反向的。
通篇读过万老师的文章,再次说明“脑海中同时持有两种截然相反的主张,但仍然具有行动能力”是何其的重要。文章中有损失者“个人”,也有得利着“商家”。站在不同的角度各有得失,当一项技术产生、发展到一定程度后,原来不为人所知或影响不大的缺点随着规模的扩大,负面影响也不断扩大。接下来解决问题的方法本身成为了问题,它需要下一个方法去解决。
网友评论