本文来源于TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING。由于工作需要,开始了解一下轨迹数据的分析思路、应用方向,这篇文章的应用点、可实现性比较恰合我的试验环境,因而认真记录一番。
1 摘要
城市规模的交通量估算在许多交通运营和城市规划的应用中都可算作一大难题。本文提出了一个混合框架,该框架结合了最先进的机器学习技术和成熟的交通流理论来估计全市交通量。除了多源数据中提取典型的城市语义特征外,我们基于交通流理论从GPS轨迹中提取一组特殊的特征,这组特征可提供有关速度-流量关系的信息。使用从行驶速度估算模型估计的网络范围速度信息,首先使用无监督的图形模型学习与交通量相关的高阶特征。然后引入交通量再解释模型,使用少量地面真实数据将交通量相关高阶特征应用到交通量预测模型进行训练。该框架数据源为33000辆北京出租车的GPS轨迹数据集和4980个视频剪辑数据。结果证明了该框架在城市交通量估算中的有效性和应用前景。
![](https://img.haomeiwen.com/i5295864/0ae81e21e4b5130d.png)
2 介绍
在本文中,进一步提供以下贡献:
- 提出了一个估算城市交通量的混合框架,该框架融合了机器学习和交通流理论;
- 提出了新的从GPS轨迹数据中提取交通流相关特征的方法,主要是从交通流理论中获得先验知识。
- 构造了新的概率图形模型用来学习与交通量相关的高阶特征。介绍了更高等级道路(公路和主要道路)和小型道路的离散图结构,以及考虑更多的影响因素。
-
开发了一个交通量重新解释模型,用以实现基于少量的真实数据学习到高阶特征与预测的交通流量之间的映射关系。
贡献
3 概括
3.1 定义
- 交通量:单位时间内通过道路参考点的车辆数量。
- 交通密度:每单位道路长度的车辆数。
-
交通流的基本模型是一个关于某条道路上交通量、交通密度、速度的关系模型
定义
- 某条道路上的交通速度随着车辆数量(密度)的增加而降低;
- 当交通不拥堵(自由流状态)时,交通量随密度的增加而增大;当拥堵时,交通量和速度都随着密度的增加而降低;
存在一个阈值或转变点分隔自由流和拥挤流状态(非拥堵与拥堵)。
速度v、密度k、交通量q的关系
3.2 框架
![](https://img.haomeiwen.com/i5295864/f9540d754e642bd0.png)
框架主要包含两个部分:行驶速度估算(TSE)和交通量估算(TVE)。
TSE包含三个组成部分:
(1)轨迹数据预处理,轨迹点与道路网的映射;
(2)城市语义特征提取,主要包括道路特征、交通模式(道路、区域)、兴趣点;
(3)基于城市语义特征,用速度推理模型来估算整个道路网络的速度平均值和标准差。
TVE包含三个组成部分:
(1)交通流特征提取,用于建立速度与交通流的关系;
(2)学习交通量的高阶特征;
(3)交通量重新解释模型对交通量进行预测。
4 TSE
4.1 轨迹地图匹配
![](https://img.haomeiwen.com/i5295864/ab513ba009d353bf.png)
综合考量轨迹点的邻接关系和路网的拓扑关系。
![](https://img.haomeiwen.com/i5295864/9fe9e6a83adde413.png)
![](https://img.haomeiwen.com/i5295864/922a060f5e6a15c2.png)
4.2 语义特征提取
主要包括道路、路网特征和历史交通模式(估算行驶速度)。
(1)属性特征
![](https://img.haomeiwen.com/i5295864/99e00b1deb715bb8.png)
- 路段特征包括长度、等级或类别(公路:70-120 km/h、主要道路:50-60 km/h、小型道路:30-40 km/h)、方向、速度限制、车道数、连通数等。
- 兴趣点(路段50米范围内的)特征,仅考虑兴趣点数量前10个类别的兴趣点(学校、公司和办公室、银行&自动取款机、购物中心、餐厅、加油站和车辆服务、停车、酒店、住宅、交通以及娱乐和生活服务),每个路段兴趣点特征为是一个长度为10的向量,向量元素的值为对应类别的兴趣点的数量。
- 全局位置特征,指路段属于城市网格中的那一部分。
(2)交通模式,主要为路段和区域两种粒度的交通模式矩阵,矩阵的每一行代表一个特定的时间短,每一列代表区域/路段,元素的值为历史数据(如过往2个月)的计算结果——(平均速度,标准差)。
4.3 速度估算模型
5 TVE
未待完续······
网友评论