美文网首页智能运输信息处理技术
关于事故发生时间离散化的思考

关于事故发生时间离散化的思考

作者: 923板凳 | 来源:发表于2016-03-18 22:40 被阅读129次

在贵阳交通事故致因分析数据大赛中,需要对事故数据进行预处理。

事故数据的预处理涉及到很多内容,事故的发生时间的处理是个可简单可复杂的事情。

在给出的数据中,17898个事故中,发生时间1069种不同时刻。从统计上来说,按照每个时刻进行统计没有足够的统计意义。因此需要将发生时刻进行离散化处理。

一般可以有以下几种方式:

1、以小时为单位离散化

将发生的时刻按照所处的时间段归入所处小时。如8:32归入8-9点时间段。在处理的时候,起始点为00分到59分。

2、按其它时间段

可以按照其它长度时间段进行离散化。如2小时或者3小时。处理方法如上。

3、按高峰期

不同的城市,高峰期的分布回有所不同,但一般会把时间分出如下时间段。早低峰、早平峰、早高峰期、午平峰、晚高峰、晚平峰、夜低峰。其中早低峰和夜低峰在此是我定义的时段。早低峰指的是1:00-5:00。夜低峰指的是23:00-1:00。主要是在午夜和后半夜的时段。

4、按日落时间

还有一种方法是按照日出和日落的时间来划分的。因为事故的发生和当时的光线有关。1月份的18点和7月份的18点,光线有着极大的不同。另外在没天不同时刻,太阳升起和落下的光线回对驾驶员的视线造成影响。如夕阳产生的眩光会造成驾驶员短暂的失明,从而造成事故。这时在进行离散化时要根据月份的推移,将不同的时间归入不同的时间段。可以参考的时间段可以为深夜、黎明前、日出、日出后、上午、中午、下午、日落前、日落、日落后、夜晚、半夜等。

相关文章

  • 关于事故发生时间离散化的思考

    在贵阳交通事故致因分析数据大赛中,需要对事故数据进行预处理。 事故数据的预处理涉及到很多内容,事故的发生时间的处理...

  • 使用spark ml做离散化(分位数离散化)

    单列离散化: 多列同时离散化: 不同离散化方式:http://www.javashuo.com/article/p...

  • 标准化和离散化总结

    离散化总结 等距离散化是根据连续型变量的取值,等频离散化根据连续型变量的总个数。

  • 离散化

    离散化指把连续型数据切分为若干“段”,也称bin,是数据分析中常用的手段。切分的原则有等距,等频,优化,或根据数据...

  • 离散化

    电影 原题链接[https://www.acwing.com/problem/content/105/] 具体离散...

  • 数据预处理_数据离散化

    一、数据离散化 1、所谓离散化,就是把无限空间中的有限个体映射到一个有限的空间中。 2、数据离散化大多针对连续数据...

  • 陕西神木一煤矿发生重大事故, 已确认21人死亡, 煤矿事故为何频

    从人民网发布的信息来看,这起煤矿事故发生时间为1月12日,事故地点陕西省神木市百吉矿业李家沟煤矿井。据了解,当天值...

  • 连续属性离散化实例

    连续属性离散化,就是将数值型变量转化为离散型变量类似于指标转维度的那种感觉 前面说过,连续属性离散化有几种方式: ...

  • 2019-04-08

    一、离散化 简单离散 通过定义一些划分规则,将原来连续的数据划分成不同的类别,从而将数据离散化。 分桶后平滑 先根...

  • 特征离散化

    详情可看https://wenku.baidu.com/view/9e45b337011ca300a6c390d2...

网友评论

    本文标题:关于事故发生时间离散化的思考

    本文链接:https://www.haomeiwen.com/subject/fdlhlttx.html