此文为学习数据分析A+课程后的第4篇内容输出。仅供参考,如有必要请购买相关课程。
一、大数据时代的来临
信息爆炸意味着一个全新的时代的到来,不论是信息产生速度还是信息的交互场景,不论是信息的存储容量还是读取效率,都发生了重大变革。这一量变到质变的过程,颠覆了数据信息匮乏,巧妇难为无米之炊的旧时期,迎来了数字、文本、语音、图像共同组成数据信息的新时期。
数据信息量变到质变的神奇力量,体现在生活的方方面面,Google的翻译就是代表。从前,我们批评一个人的翻译能力差,会说:你这是用Google翻译的吧。现在,虽然Google的这套算法没有变,但运行的结果因为数据信息的爆发式增长,而形成更贴近真人语言的结果。
二、数据挖掘技术的诞生
挖掘数据的前提是拥有大量的数据,即数据的存储技术的发展。
挖掘数据的目的是为了解决需求,存储和挖掘都是为了实现这一目的而存在的。
为了解决需求,随着存储技术的不断提升,挖掘技术也实现了很大的变革。从过去的传统统计学只是基于样本数据进行分析,存在较大的系统性偏差,人们永远无法证明样本的代表性的阶段发展到现在我们基于全量数据提取信息,数据挖掘也更多的充当了顾问的角色。因为它的精准度在提升,对我们的生活的指导意义也就越大。
2018年,我接触到了语音写作和时间记录,这些都是通过积累数据的方法来提升对自我了解的,这让我逐步在积累个人大数据。它帮助我看到了自己的行为模式,对它的挖掘有助于我优化自我,因此它是指导生活的算法。
1.用算法发现复杂中的规律
通过对个人大数据的收集,我从语音写作中发现自己的思维模式,发现自己在相当长的一段时间内思考的重心落在自我提升和学习上,这也可以预测到我迟早会和这门课程相遇。因为我的工作与此紧密相关,我需要提升能力。因为我不是坐以待毙混日子,而是喜欢学习且不断发现学习机会进行自我投资的人。
数据本身也许并没有价值,但当我关注到它意味着什么的时候,就是抽象总结出了它的规律,就能为我服务,解释和改变我的行为。
2.合理使用数据不过度沉迷细节
在每天的语音写作练习中,我会通过自己的语言形成大量的文字。如果沉迷于文字的细节,那么我就可能畏首畏尾,写不出一天一万字的水平。数据量的缩水对于自我探索的难度就会加大,因此我会允许有质量不好的文字输出。它是我的碎碎念,却也是更好地内容的启发点,是一种热身。对细节的宽容,让我们能放开视野看清楚大的方向。
3.用数据管理时间提升效率
时间记录是帮我做到这一点的有效工具,我用它记录我每天都在什么时间段做了什么事情,这样我之后就能分析出,我这一天的效率如何,也更能明白自己更愿意把时间投放在哪儿。
比方说,在开始CDA A+课程后,我开始精细化学习,在持续4天4课的学习中,我做了大量笔记并写了相关的复盘文章,共投入时间13小时51分钟。它让我看到我当前把提升数据分析水平放在首位,它是我的重要的事情,是截止毕业前需要大量投入学成的事情。
对于时间的排布,其实是一个数学问题。科学的排布可以让我们活得更高效也更有价值。
数据的记录带给我不会被遗忘的记忆,因为我有理性的时间记录和感性的语音写作作为我的个人数据信息,用自身验证了“凡走过,必有痕迹”的说法。
当然,如果不是科学技术的发展,我也不可能利用这些工具记录我的生命,也不可能遇到指导我记录的剑飞老师。这种新时代的学习模式,让我可以把个人大数据和数据科学学习和记录的更清楚和明白,也让他们更好的结合在一起做更多的事情。
三、大数据研究不是万能的
数据科学不是灵丹妙药,虽然说了种种数据分析带给这个世界以及我个人的好处,但它依然有自身的一些局限性,那就是它并不能替我们做思考和决策,也不可能100%准确,更不能帮我们主观的去定义问题。这些都需要我们自己动脑去解决和处理。它像是巧妇的米,做成米汤、米饭、寿司等等需要我们自己去抉择。
正因为存在这样的抉择的权利,瑞典数学家的那句,用数据说谎很容易,但用数据说出真相很难。值得我们警醒。
网友评论