下面的数据分析案例使用了kaggle数据集:1970~2015年恐怖袭击事件。
确定可视化分析目标
1. 反恐多年,成效如何,呈现的发展态势是怎么样的
2. 全球恐怖袭击案例主要分布在哪些区域
3. 美国地区恐怖事件分布
4.攻击对象
导入数据,总共有11万多条数据,137个变量。
根据分析目标,从中选取需要的变量。变量依次为:
事件ID,年,月,日,国家标号,国家文本,
纬度,经度,(画地图使用的映射)
地区标号,地区文本,城市,事件是否成功,攻击类型编号,
攻击类型文本,目标类型编号,目标类型文本,武器编号,
武器类型文本
数据预处理
日期数据处理
将分开的年月日数据进行合并处理,处理结果如下:
可视化分析
分析目标1: 反恐多年,成效如何,呈现的发展态势是怎么样的?
从图上可以看出恐怖袭击事件在前期是以缓慢增长的态势,在中期有个极具下降的趋势,然而好景不长,在之后,能看出恐怖袭击案件是以指数增长趋势发展。
我们可以局部放大下,下图是从2007到2015案件发展散点图。后期呈现下降趋势,反恐计划还是有所奏效的。
分析目标2:全球恐怖袭击事件主要分布区域
可以看出,恐怖袭击案件最高发地区为东欧,中东南非,西欧,亚洲南。
在这些区域当中,我们还可以了解哪些是造成恐怖袭击发生率高的,它是以怎么样的发展形势产生的,实现代码:
从下图可以看出从2010开始,各地恐怖袭击事件发生的次数明显比之前多。东欧,中东南非,西欧,亚洲东南部恐怖事件发生率比较陡峭。拉高了全球恐怖袭击总体趋势。
分析目标3:从之前的全球分布图,可以看出我国的恐怖袭击事件还是相对较少的。那美国作为世界霸主,它的发生发布情况,是怎么样的呢?
实现代码:
从数据分析结果可以看出,美国东部和加州为恐怖事件高发地区。
分析目标4:应对恐怖袭击,安保是项重要工作:。知己知彼,我们需要了解恐怖袭击主要攻击的手段类型,主要攻击目标,使用的武器。
种数据分析结果可以得出:
从图上可以看出:
1)轰炸,爆炸 是犯罪分子最常使用的犯罪武器
2)经常攻击的目标是商业,军队,警方和普通公民。
数据分析总结
选择了一个几乎是文本型的数据集,折腾了好几天才画出上面的图。
学习的最好方式还是应用,刚开始打算先看一遍那些包再进行操作。用了2天时间,第一天是蒙的,第2天以为自己懂了,第3天操作,才发现然而什么并不懂。
还好在这个过程当中,遇到一些问题都能够顺利解决。从这个案例当中汲取最深刻的教训是数据一定要清理干净,完整。否则你想象不到它会出来个什么样的天书。
本文内容来自大数据社群会员黄马克的实践笔记。
多年来学校给我们的教育都是填鸭式的,只是教我们理论,却从来不告诉我们如何使用知识,这导致很多人在学习过程中逐渐丧失了兴趣。
其实,知识只有在使用中学习才能迅速掌握,实践才是学习的最好办法。
点击下面“阅读原文”,看大数据社群会员 黄马克 如何在实践中学习新技能。
网友评论