当数据越来越多的时候,就需要分类管理。否则,就会手忙脚乱。
你的数据池里,内部数据有多少?刑侦数据有多少?人的数据有多少?部局下发的数据有多少?HBASE方式存储的数据有多少?
如果回答不上来,就说明你不了解分类。做不到合理分类,就谈不上科学管理,更谈不上数据资产化管理。所以,研究数据分类很重要。
公安大数据常见的分类方法有:
1、按警种分,有刑侦、治安等分法,具体有多少类,看本地的警种有多少个。
一般情况,谁的业务,数据就属于谁。谁采的数据,就归属于谁。
2、按来源分,分内部数据和外部数据两个大类。
内部数据是指公安业务所生产的数据。例如:人口数据、车辆数据等,八大资源库就是内部数据的典型。
内部数据按来源分,又可细化为部、省、市、县4类。
外部数据是指由公安机关之外的单位生产,不适宜分到内部数据的数据种类。例如:宾馆旅客、网吧上网、工商税务等数据。
外部数据按来源分,又可分为党政军部门、企事业单位、其它社会数据3类。
3、按要素分,分为人、地、事、物、组织五要素。
所有的数据不会脱离这五类。
4、按生产系统分,一个业务系统生产的多张数据表,在管理时归属到该业务系统,方便溯源。
5、按存储方式分,根据实际情况,有orical、hbase、mpp、hive等。
6、按数据格式分,有结构化数据、非结构化数据。非结构化数据又分为视频、图片、音频等。
以上是常见分类方法,实践中根据需要还可以有更多分法。
在明确分类方法之后,当一张数据表入库或变更时,即按照以上分类方法,给这张表贴上分类标签,方便管理。
网友评论