编程技能是数据分析的既不充分也不必要条件
在没有计算机和编程的时代里,数据分析就一直存在。在古代,有个东西叫作「术数」,其中八字算命算是最能举例的。所谓的测八字,就是根据出生的年、月、日、时,以及出生地来看人一生命运的走向。其实这也是一种用数据来进行分析的方法,只不过看上去比较玄乎罢了。
而在计算机编程还没有像现在这样普及的时候,很多数据分析是在纸面上进行的。即使到现在,大多数的会计依然会用 Excel 来做分析。所以即使不会使用编程语言,依然可以进行数据分析。
编程技能,是利用编程语言对计算机进行操作,从而能快速完成复杂的计算。数据分析确实需要用到计算,但不是所有运算都复杂到非要用计算机才能完成。通过简单的四则运算,也可以完成对平均数等集中程度的运算,对某些数值的分布做出判断。例如注册会计师对一个企业进行财报的分析,并不需要特地写一个程序进行,只需要对几列值进行四则运算就可以得出想要的结论。他的工作更多的是观察数据的变化是否合乎常理,是否存在作假,而这些判断也不是编程就能完成的。因此,编程技能并不是数据分析的必要条件。
然而,编程技能也不是数据分析的充分条件。随着移动互联的普及,这个时代里,我们收集到数据更多了。在大数据领域用到的计算机技能,并不限于编程技能,这个过程包括数据的收集、清洗、整理。就收集这一步而言,可能就涉及到计算机网络、分布式存储、网络安全等各方面的知。也就是说,光懂得一门或多门编程语言,掌握编程的技巧,而没有计算机底层的知识,也不足以支撑起数据收集的业务。而在数据的清洗和整理的过程中,由于数据量越来越多,对处理数据的速度要求也越来越高,这就要求数据分析者的算法基础比较扎实。
那么,是不是就可以越过编程去搞数据分析呢?答案也是否定的。是否掌握编程,类似于在荒野求生里,有没有武器和装备。赤手空拳活到最后的情况当然存在,但概率极低;装备和武器越是精良,生存的可能性也就越高。编程水平越高,数据分析的时候也会越得心应手,但这不是全部。
数学为了分析,分析为了决策
虽然 Excel 可以进行金融财报方面的数据分析,但如果要一次性处理很多报表,用编程效率会更高。而当分析的数据规模变大,维度变多,仅依靠四则运算无法完成处理,就需要更高级的数学技巧进行处理。
现在火得一塌糊涂的人工智能,各种机器学习深度学习的框架,归究到最后,都是数学处理方法。层出不穷的各种算法背后,数学是人工智能算法的核心。
只会用框架的分析是没有灵魂的。在现实业务中,所有的数据背后都有对应的逻辑。同样是现金流量,在会计师的眼里,和在运营的眼里,就是不同的逻辑。如果对所分析领域并不了解,哪怕套用了再厉害的模型,出来的结论也是「人云亦云」。
收集数据,整理数据,对数据进行运算,最终都是为了得出结论。而经过分析得出的结论,都是为了决策。决策,意味着对自己的分析负责。人工智能不能代替人类的地方,就在于是由人类做出决策。如果只是观察了数据,得出了现象,却不能给出业务所需的措施,这样的分析是没有意义的。
在数据分析的过程中,所有的技能和基础知识都是服务于分析对象的,不管什么手段,只要能得出的措施能得到想要的效果,就是好手段。所以基础要打牢,技能要练好,但不能拘泥于技术。作为技术人,非常容易陷入死磕技术的层面,但实际上,要多睁开眼,去看看实际的业务是怎样的,这样才会真正理解数据的含义。
而即使是这样,得到的结论,也不一定就有用。因为数据是会说谎的。从收集数据起,得到的可能就是不真实的数据。例如爬取社交网络的信息,有多少人会在社交网络上发布完全真实的状态呢?经过夸张、揶揄或各种其他修辞的文字,真的能够反应出用户的心理吗?而在数据清洗的过程里,又会筛掉许多信息,这些信息并不是无关紧要的,只是可能不符合格式。而丢失的这一角,也许才是分析的关键。
另外,在当下所有社会学科都是「统计先行」的状况下,不被统计意味着不存在。有太多分析微博、朋友圈的文章了,但事实上,依然有大量不使用这些社交媒体的人存在。如果一个社会话题,仅从能抓取到的数据分析,得到的答案必然是偏颇的。那些无法发声的人们,可能才是这个社会话题的核心人群。
因此,数据分析不是万能的。我们今时今日学到的所有知识和技巧,都不足以概括和预测这个世界。怀着一个敬畏的心态看待自己所想从事的行业,并不是说说而已。
丛林里有两条路,选难的那条
数据分析这条路上,现在挤满了人。各种学习网站都在开设各种数据分析课程,与之相关的招聘岗位也看上去非常高薪。但数据分析本来就是一件复杂的事情,是没有学会了某项技能就能掌握数据分析这样的说法的。由此我不相信它能在三个月内速成,并走上任意一个高薪的数据分析岗位。
速成也好,调包侠也好,都是简单的路,这条路上,是真的挤满了人,每块石头都被翻过了。真的仔细学习计算机基础,数学基础,并选定自己想要研究的行业,对它进行深入地挖掘,看起来是条崎岖又迂回的道理。
然而即使是难的这条路,说实话到底有多难,不得而知。我自认资质一直平平,反应也比较慢,自然不能是图灵祖师爷那样的天才。但如果是前人已然得出的结论,不需要发现只需要接受运用,想来再难也不过是走前人走过的路。前人都已经开好的山,我是没有资格说什么筚路蓝缕的。只是学而已,根本没什么大不了。
大不了慢一点,但是稳一点。一个月过去,从事了一些实际的分析工作,做过了一些决策,回头看看,当时为自己选的这条相对迂回的路,是有价值的。而究竟价值几何,我有我的山,需要我自己去走,也是因为这样,这条路也真正有了不起的地方。
网友评论