6.如何处理数据?美国斯坦福大学教授阿图尔·布特说:“隐藏在成堆数据内部的知识能改变一个病人的生活或者改变世界。”诚然,数据无处不在、大量繁杂、不断产生,我们该用什么方法来处理数据,从而挖掘出数据背后蕴含的巨大价值。电子科技大学教授周涛认为:“统计理论和机器学习对于理解和应用大数据最有帮助。这两者背后各有一套认识和处理‘数据世界’的理念,其中前者能够帮助我们更深刻地理解这个世界并且揭示新的现象,而后者能够帮助我们去解决遇到的问题。”关于统计理论和机器学习,就我的认识来说,如果我们不专门从事大数据相关工作,掌握一定的统计理论,日常工作中注意加强数据分析和数据统计,会使我们的工作更富有数据理性;如果再把数据以可视化的图表等形式显示出来,可能会让领导更满意于我们的工作。至于机器学习,听起来很玄奥,我的理解是机器运算过程能够自适应,以目标为方向,自动调整系数,实现最大优化。
7.如何培养数据意识?从认识到行动向来都有一段很长的路要走。说大数据是当今尤其是未来时代的主流声音,估计没人会反对,也没人会反对数据的重要性,然而,真正落实到细节上,用数据来管理、靠数据来说话,就没有那么容易了。不过,无论接受也好、拒绝也好,该来的总是会来的,不能只看到什么力量很强大,关键是要看到什么力量正在生长。我感到,既使不掌握复杂的统计理论和机器学习算法,也可以从以下三个方面入手,培养自己的数据意识、增强数据素养。
ⅰ.自觉积累数据。在日常工作中,主动搜集、积累与业务相关的数据,形成自己的业务数据库,并分门别类加以整理。这里的数据,不只指具体的数字,也包括文本、图像和视频等非结构化的数据。
ⅱ.加强数据统计。业务数据库建立起来后,不能成为闲置的“数据仓库”。不妨对一些重要的数据,进行分类统计,并形成可视化的图表。比如,单位人员的性别分布、年龄分布、学历分布、专业分布等等。
ⅲ.强化数据分析。光有简单的统计分析,还不足以充分挖掘数据背后的价值。还应该根据工作需要,提取关键特征,并根据这些特征进行分析,给出更有说服力的结论。比如,考察某个老师的课受欢迎程度,就可以分析选课学生的数量、与老师交流的人次、上课打瞌睡的人数、学生的评价等次等关键特征,并与平均水平进行比较分析,从而作出相对客观的评价。
8.大数据带来哪些隐忧?我们走在大街上,经常处于摄像头的注视之中;我们用淘宝买东西,我们的购物习惯被阿里巴巴记录,并能够分析出我们的经济状况;我们用手机与朋友打电话聊天,我们的通话记录被移动、联通等公司收集……更可怕的是别有用心的骗子能够获取我们的个人信息,了解我们的需求,进行针对性更强的诈骗。比如,有的学生这边刚收到录取通知书,准备办理助学贷款,那边骗子就电话告知如何办。如果各类信息进一步关联,我们时刻生活在“第三只眼”的监视之中,那我们的个人隐私如何保证?除了隐私受到威胁,《大数据时代》一书还提到了另一个隐忧:我们会不会因为根据大数据预测出我们将会做什么而受到惩罚,而实际上我们什么也没做,这就威胁到了我们的自由。
9.越是数据扑面而来,越要懂点哲学。毋庸置疑,大数据必将在未来绽放出耀眼的光芒,特别是在人工智能和行为预测方面,大数据为我们认识世界和改造世界提供了一种新的选择和路径。然而,大数据是一种资源,也是一种工具,这取决于能够被正确使用。我们不能盲目信任数据的力量和潜能而忽略了它的局限性,更不能单纯为了数据而数据。为了更加深刻理解数据、运用数据,我们还是要懂点哲学,掌握科学的方法论。这样,可能我们会更加辩证的看待数据,而不是让数据主宰一切;更加系统的运用数据,而不是过于放大某个数据的作用;更加理性的掌控数据,而不是让数据隐忧成为现实,等等。
10.数据是冰冷的,人性才是鲜活的。大数据将改造我们的生活,优化、提高、高效化我们的工作,并很大可能成功预测我们的行为,甚至随着人工智能的发展,真的出现《未来简史》中所预测的无用的人、没有自主的人、神人三类人。然而,人是能思想的存在,人类最本质的东西即是理性思维和自由选择。大数据终究很难抹煞人类的创造力、直觉和天赋,也很难体现人类所特有的意外、错误和冒险精神。美国前国防部长麦克纳马拉,是典型的数据控,但也不得不在一次演讲中说道:“事实上,真的不是每一个复杂的人类情况都能简化为曲线图上的线条、图表上的百分点或者资产负债表上的数字”。我们在使用大数据这个工具时,还是应当怀有谦恭之心,铭记人性之本。
网友评论