1.轨迹表示方法
轨迹表示方法(trajectory representation)是轨迹数据处理与分析需要首先考虑的基础问题,是将轨迹数据变成机器内部的形式化表示结构的方法。用来表示车辆轨迹的特征项可以是多种类别,一般包括:轨迹序列数据(包含空间GPS坐标点序列,以及这些GPS点序列对应的时间戳序列)、轨迹上下文属性信息(车辆ID、乘客ID等)。轨迹序列数据的表示方法有:
-
基于经纬度的表示(lon/lat representation):使用轨迹点的原始经纬度坐标序列的表示方法,一条长度为N的轨迹可以表示为:
经纬度表示轨迹 - 基于网格的表示(grid representation):将轨迹表示为网格空间中的离散化特征,并将他们的序列通过RNN模型来估计下一个时间步的转换概率,并通过RNN encoder-decoder框架基于随机采样来估计候选目的地的访问概率。然而,该方法较难利用时间戳信息,而时间信息在城市轨迹模式中有着重要的意义。网格可以是方形的,也可以是蜂窝状的。
- 基于道路网络的表示(network representation):基于受限道路网的轨迹表示法,常用于车辆轨迹的建模和挖掘。通常,使用基于图的分析方法。
2.轨迹预测方法
下一站预测、耗时预测,以及目的地预测受到了较多的研究关注。根据前序的部分轨迹序列来预测出行的最终目的地,已有的方法大多基于模式的方法和基于模型的方法。基于模式的方法从历史数据中抽取移动模式,并基于这些模式来预测目的地。已出现了许多这个方向的研究成果,例如序列模式、周期模式等。这些方法可以找出显性的模式,但较难寻找出隐含的规律。基于模型的方法从轨迹特征中学习统计模型,并基于这些模型来进行预测。随着机器学习方法和深度学习方法的大量应用,研究者们提出了许多预测模型:
- 贝叶斯推理预测模型,使用外部信息来提升预测效果,并通过贝叶斯推理来计算预测目的地的概率。
- 马尔科夫模型,提取相邻位置的子轨迹,并组装为合成轨迹,然后使用马尔科夫模型来量化相邻位置的相关性;基于分割的轨迹来建立马尔科夫模型,通过聚类轨迹片段来获得潜在的新的轨迹片段。
- 基于轨迹聚类模型来预测出行的最终目的地,例如采用对轨迹进行高斯混合聚类,然后将模型用于对新的轨迹进行分类。
- 使用神经网络模型,例如,ECML/PKDD-2015的优胜者采取了神经网络的方法,将训练轨迹数据的前后各5个点和多种属性数据进行向量化,并对目的地位置进行Mean-Shift聚类,构建了多层感知机来进行目的地预测并获得了不错的结果。
- 最近邻轨迹法(Nearest-Neighbor Trajectory, NNT),基于当前的前序轨迹信息来计算最相似的历史轨迹数据。
- 使用构建和搜索模式树的方法来匹配候选运动模式。
3.特征构建(feature construction)
- 基于轨迹序列的方法
- 结合上下文信息的方法
网友评论