这几天在琢磨如何学习大数据分析,说来也怪,这个概念不是最新的,已经发酵了有一些年头了,而且也深入人心,有几次万门大学推课的时候,还学了几课。不过都是浅尝辄止,不知道这次自己能坚持多久,希望可以坚持到学有所成的时候吧。
不得不说B站是个宝库,基本我想学的知识都有,感动中,这个不是硬广。
一直以来我脑子把大数据和Python关联在了一块,实际上不全对。数据分析关键用的还是统计学的一些概念,包括对数据的探索,集中趋势(均值,平均数,中位数),离中趋势(标准差,方差)来表示数据离散或者风险,我们有的时候也是在不经意中使用,只是自己浑然不觉而已。分类预测,牵涉到的可能是比较新一点的知识,回归,log回归,决策树,朴素贝叶斯,SVM等。这个当中用到的可能就不是简单的一组数据,会提到大数据的概念。我们有了一堆的数据,如何用模型来定量分析?而包括Python,R语言在内的都只是工具而已,是帮我们实现分析的。如果没有基本的思路,那些工具显得很苍白。
关于数据分析和数据挖掘,我也是第一次了解到。大数据偏向的就是数据挖掘,数据分析更偏向的是小打小闹,小样本。面对大数据,我们才需要有深刻的数据挖掘。
突然之间觉得,机器学习也不是那么的遥不可及,突然有种亲近感。刚入门,有点统计学和数学的基础,python可能也不算入门。为了更好的分析国网投标数据,接着学习吧。
网友评论