基于收费数据的高速公路断面交通流特性分析 焦港欣张俊峰杨灿2 a.北京航空航夭大学车路协同与安全控制北京市重点实验室,北京100010 b.北京航空航天大学合肥创新研究院,合肥23000) 瘸要:高速公路交通流特性分析是交通流理论硏究的核心,基于髙速公路收费数 据进行数据挖掘,并对其表现岀的交通特性进行深度分析,具有十分重要的现实意 义。基于此,本文从实际收费数据提取基本交通参数,并以此为基础进行高公路 的不同车型出行规律分析,接着进行断面流量时空分布特性的分析,最后基于SPSS 进行混合流车速分析。 关键词 高速公路,收费数据,交通流特性分析 中图分类号:U238 Characteristic Analysis of Highway Section Traffic Flow Based on Toll Data Jiao Gangxin, Zhang Junfeng, Yang Can (1. Beijing Key Laboratory of Vehicle Routing and Safety Control, Beihang University, Beijing 100010: 2. Hefei Innovation Research Institute, Beihang University, Hefei 23000) Abstract: Characteristic analysis of highway traffic flow is the core of traffic flow research. It is of great practical significance to conduct data mining based on highway toll data and to analyze the traffic characteristics. Based on the above, this paper extracts the basic traffic parameters from the actual toll data, then carry out further analysis, including the travel patterns of different vehicle types of the highway analysis, the time and space distribution characteristics of the cross-section flow analysis, and finally the mixed-flow speed analysis based on SPSS analysis key words: highway, toll data, traffic flow characteristics analysis 引言 随着现代化高速公路收费系统的推广,高速公路收费系统数据采集成本大大降低、覆盖 率大大升高,早期收费数据的利用往往是基本的查询和统计分析,利用率较低,后期有学者 基金项目:北京新机场高速公路“智慧高 点关键技术研究与示范应用北京市交通行业科技项目(项 目编号ZC179074Z) 通讯作者:杨灿,邮箱 yangcanahu@126com,北京航空航天大学合肥创新研究院 (c)1994-2019ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp://www.cnki.net
基于收费数据的高速公路断面交通流特性分析1 焦港欣 张俊峰 杨灿 2 (a.北京航空航天大学 车路协同与安全控制北京市重点实验室,北京 100010; b.北京航空航天大学合肥创新研究院,合肥 23000) 摘 要: 高速公路交通流特性分析是交通流理论研究的核心,基于高速公路收费数 据进行数据挖掘,并对其表现出的交通特性进行深度分析,具有十分重要的现实意 义。基于此,本文从实际收费数据提取基本交通参数,并以此为基础进行高速公路 的不同车型出行规律分析,接着进行断面流量时空分布特性的分析,最后基于 SPSS 进行混合流车速分析。 关键词: 高速公路,收费数据,交通流特性分析 中图分类号:U238 Characteristic Analysis of Highway Section Traffic Flow Based on Toll Data Jiao Gangxin1 , Zhang Junfeng1 , Yang Can 2 (1. Beijing Key Laboratory of Vehicle Routing and Safety Control, Beihang University, Beijing 100010; 2. Hefei Innovation Research Institute, Beihang University, Hefei 23000) Abstract: Characteristic analysis of highway traffic flow is the core of traffic flow research. It is of great practical significance to conduct data mining based on highway toll data and to analyze the traffic characteristics. Based on the above, this paper extracts the basic traffic parameters from the actual toll data, then carry out further analysis, including the travel patterns of different vehicle types of the highway analysis, the time and space distribution characteristics of the cross-section flow analysis, and finally the mixed-flow speed analysis based on SPSS analysis. key words: highway, toll data, traffic flow characteristics analysis 一、引言 随着现代化高速公路收费系统的推广,高速公路收费系统数据采集成本大大降低、覆盖 率大大升高,早期收费数据的利用往往是基本的查询和统计分析,利用率较低,后期有学者 基金项目:北京新机场高速公路“智慧高速”重点关键技术研究与示范应用北京市交通行业科技项目(项 目编号 ZC179074Z) 通讯作者:杨灿,邮箱 yangcanahu@126.com,北京航空航天大学合肥创新研究院
进行更多的分析使用,如陈家炎以联网高速公路交通流作为研究对象,利用高速公路现 场实测数据与高速公路联网收费数据,分析高速公路交通流特征参数:万金鹏2通过对联网 收费数据进行分析处理,估算任意断面交通流量,并通过构建交通流量数据仓库进行交通流 量多维分析:于晓桦等人借助高速公路收费系统中的交通流数据,提出了时空相关性判别 。 Kerner通过处理浮动车采集的数据得到路网中各个路段的旅行时间,基于FCD模型分 析同一条路段不同时间内的变化规律来判断道路的交通状态: Dragons基于GPS数据研究 流量估计模型和路网密度,设计了路网不同交通流参数组成的宏观基本图。 但是这些研究多集中于交通流参数的分析、时空判别等方面,对基于高速公路的交通流 特性方面的分析并不算太多。故,本文从满足交通管理者的管理需求出发,对北京市高速公 路收费数据进行处理,首先估算断面流量和平均车速,然后基于此进行高速公路断面流量分 析和速度分析,通过这些分析数据为高速公路的精细化运营提供依据 二、断面交通参数估算 (一)异常值处理 初始的收费数据一共包括十六类信息。为了避免异常数据的影响,通过阈值法等对原始 收费数据进行处理同,转换为适合处理的可靠数据,然后对数据进行数据抽取,提取需要的 字段信息。 经过对数据的观察与筛选,决定选用时间阈值惩罚算法对数据进行进一步清洗,选择的 置信区间为: (2.1) 其中,t为选取时间周期里的起始时间,bo为选取时间周期里的长度,n斜体表示所取 t分钟时间段内相应车辆流水条数,T为选取时间周期里的行程时间,T为选取时间周期 里的行程时间均值。 经过预处理后的收费数据提取的字段包括唯一标识、入口时间、入口站编码、出口时间 出口站编码、车型。 (二)车辆行驶路径长度估算 结合高速路网拓扑结构和交通流特性,以高速公路相邻收费站点(170个)作为控制节 点,进行划分,划分后路网由m个路段组成,分别是路段1、路段2、…、路段m (c)1994-2019ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp://www.cnki.net
进行更多的分析使用,如陈家炎[1] 以联网高速公路交通流作为研究对象,利用高速公路现 场实测数据与高速公路联网收费数据,分析高速公路交通流特征参数;万金鹏[2]通过对联网 收费数据进行分析处理,估算任意断面交通流量, 并通过构建交通流量数据仓库进行交通流 量多维分析;于晓桦等人[3]借助高速公路收费系统中的交通流数据, 提出了时空相关性判别 法。Kerner[4]通过处理浮动车采集的数据得到路网中各个路段的旅行时间,基于 FCD 模型分 析同一条路段不同时间内的变化规律来判断道路的交通状态;Dragons[5]基于 GPS 数据研究 流量估计模型和路网密度,设计了路网不同交通流参数组成的宏观基本图。 但是这些研究多集中于交通流参数的分析、时空判别等方面,对基于高速公路的交通流 特性方面的分析并不算太多。故,本文从满足交通管理者的管理需求出发,对北京市高速公 路收费数据进行处理,首先估算断面流量和平均车速,然后基于此进行高速公路断面流量分 析和速度分析,通过这些分析数据为高速公路的精细化运营提供依据。 二、断面交通参数估算 (一)异常值处理 初始的收费数据一共包括十六类信息。为了避免异常数据的影响,通过阈值法等对原始 收费数据进行处理[6],转换为适合处理的可靠数据,然后对数据进行数据抽取,提取需要的 字段信息。 经过对数据的观察与筛选,决定选用时间阈值惩罚算法对数据进行进一步清洗,选择的 置信区间为: 0 0 0 0 2 2 1 1 1 1 ( ) ( ) , t t t t t t t t i i t t t t T T n n n n i i T T T T (2.1) 其中,t 为选取时间周期里的起始时间, 0 t 为选取时间周期里的长度, n 斜体表示所取 0 t 分钟时间段内相应车辆流水条数, i T 为选取时间周期里的行程时间, T 为选取时间周期 里的行程时间均值。 经过预处理后的收费数据提取的字段包括唯一标识、入口时间、入口站编码、出口时间、 出口站编码、车型。 (二)车辆行驶路径长度估算 结合高速路网拓扑结构和交通流特性,以高速公路相邻收费站点(170 个)作为控制节 点,进行划分,划分后路网由 m 个路段组成,分别是路段 1、路段 2、…、路段 m
为了计算车辆平均速度,需要首先确定车辆行驶路径的长度。由于距离最短是一种简单 且易接受的路径选择方法,且在实际中选择“绕道”的情况较少,因此本文将车辆进出收费站 站点间的最短路径长度估计为行驶路径的长度。 基于 Dijkstra算法原理,本文首先对路网各点进行编号,创建包含170个节点的邻接表 并存储路网网络拓扑数据结构,然后用 MATLAB读取邻接表数据,利用自带dst函数对路网 共170个节点的最短路进行计算,输出结果为矩阵形式,接着使用 vlookup函数语句识别站 点编号并匹配到收费数据中,将矩阵中对应的最短路,通过识别站点编号匹配到收费数据中 求得任意两个站点之间最短距离,即估计为车辆行驶路径长度1。。 (三)断面流量估算 将站点编号为收费站1、2、…1…j…。那么在某个确定的时间范围内,从i收费站进 打算从j收费站出,但是在出口前仍留在路段上的车辆数Y(i,j)可表示为: Y(i,j)=Y(i,j-1)-X(,j-1) (3.1) 其中,Y(,j为i收费站作为进口驶入路段,j收费站作为出口前仍留在路段上的车辆 数,Y(,j-1)为i收费站作为进口输入路段,j-1收费站作为出口前仍然留在路段上的车辆 数,X(ij-1)为i收费站作为进口输入路段,j-1收费站作为出口出去的车辆数。 j收费站前的路段断面流量N(j)可表示为 N()=∑Y(,n (32) (四)车辆平均速度估算 收费数据中包含了到达入口收费站和离开出口收费站的具体时间,在计算车辆的平均速 度时,分析发现本文收费数据中没有发现车辆排队现象,则车辆的速度计算公式为: L 其中,L为车辆行驶路径的长度,T为车辆的旅行时间。 因此,当车流是混合流时,车辆的平均行程速度为 (34) ∑ (c)1994-2019ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp://www.cnki.net
为了计算车辆平均速度,需要首先确定车辆行驶路径的长度。由于距离最短是一种简单 且易接受的路径选择方法,且在实际中选择“绕道”的情况较少,因此本文将车辆进出收费站 站点间的最短路径长度估计为行驶路径的长度。 基于 Dijkstra 算法原理,本文首先对路网各点进行编号,创建包含 170 个节点的邻接表, 并存储路网网络拓扑数据结构,然后用 MATLAB 读取邻接表数据,利用自带 dist 函数对路网 共 170 个节点的最短路进行计算,输出结果为矩阵形式,接着使用 vlookup 函数语句识别站 点编号并匹配到收费数据中,将矩阵中对应的最短路,通过识别站点编号匹配到收费数据中, 求得任意两个站点之间最短距离,即估计为车辆行驶路径长度[7-8]。 (三)断面流量估算 将站点编号为收费站 1、2、…i … j …。那么在某个确定的时间范围内,从 i 收费站进、 打算从 j 收费站出,但是在出口前仍留在路段上的车辆数 Y i j ( , ) 可表示为: Y i j Y i j X i j ( , ) ( , 1) ( , 1) (3.1) 其中, Y i j ( , ) 为 i 收费站作为进口驶入路段, j 收费站作为出口前仍留在路段上的车辆 数, Y i j ( , 1) 为 i 收费站作为进口输入路段, j-1 收费站作为出口前仍然留在路段上的车辆 数,X i j ( , 1) 为 i 收费站作为进口输入路段, j-1 收费站作为出口出去的车辆数。 j 收费站前的路段断面流量 N j ( ) 可表示为: N j Y i j ( ) ( , ) (3.2) (四)车辆平均速度估算 收费数据中包含了到达入口收费站和离开出口收费站的具体时间,在计算车辆的平均速 度时,分析发现本文收费数据中没有发现车辆排队现象,则车辆的速度计算公式为: L V T (3.3) 其中, L 为车辆行驶路径的长度, T 为车辆的旅行时间。 因此,当车流是混合流时,车辆的平均行程速度为: n i i nL V T (3.4)
三、交通流特性分析 (一)流量分析 1.车型比例分布特征 高速公路上的车辆种类比较多,基于相关车型分类标准进行分析,可得到不同车型的车 流量占全部车流量的比例,如图1所示。 各车型占比示意图 2.95% 客车一类车 1,90% ■客车二类车 6.24% ■客车四类车 货车一类车 4.78 m货车二类车 64.11% 图1全部流量各车型占比图 由上图可知,道路上行驶车辆数量最多的是客车一类车,占比达到了6411%,然后为 占比均在5%以上的货车五、二、一、三类车,总占比达到了2234%,剩余的1355%为其他 车型。车型占比一定程度上反映了该地区的产业结构和经济发展水平以及趋势。如果货车占 比小于客车占比,就说明该道路所在地区产业结构主要为资金和信息密集型产业;如果客车 占比小于货车占比,就说明该道路所在的地区产业为资源密集型产业占主导明。可以看到绕 城高速公路出行需求主要来源于客车一类车,这往往是私家车出行;然后出行需求主要来源 于货车一、二、五类车,这几类车主要是小型载货车以及大型载重货车,这部分主要涉及到 货物运输以及工业生产。 2不同车型的流量时变特性 各种车型的出行目的通常也是有区别的,因此呈现出的流量时变特性。本文引入流量比, 分析日断面流量。其定义如下 q (4.1) Q 其中,q为每个小时的断面流量,Q为每天的断面流量 (c)1994-2019ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp://www.cnki.net
三、交通流特性分析 (一)流量分析 1. 车型比例分布特征 高速公路上的车辆种类比较多,基于相关车型分类标准进行分析,可得到不同车型的车 流量占全部车流量的比例,如图 1 所示。 图 1 全部流量各车型占比图 由上图可知,道路上行驶车辆数量最多的是客车一类车,占比达到了 64.11%,然后为 占比均在 5%以上的货车五、二、一、三类车,总占比达到了 22.34%,剩余的 13.55%为其他 车型。车型占比一定程度上反映了该地区的产业结构和经济发展水平以及趋势。如果货车占 比小于客车占比,就说明该道路所在地区产业结构主要为资金和信息密集型产业;如果客车 占比小于货车占比,就说明该道路所在的地区产业为资源密集型产业占主导[9]。可以看到绕 城高速公路出行需求主要来源于客车一类车,这往往是私家车出行;然后出行需求主要来源 于货车一、二、五类车,这几类车主要是小型载货车以及大型载重货车,这部分主要涉及到 货物运输以及工业生产。 2.不同车型的流量时变特性 各种车型的出行目的通常也是有区别的,因此呈现出的流量时变特性。本文引入流量比, 分析日断面流量。其定义如下: q Q (4.1) 其中, q 为每个小时的断面流量, Q 为每天的断面流量
对不同车型的λ进行统计分析,以时间为横轴,以该车型在总流量中所占比例为纵轴绘 制各个车型的交通量时变系数曲线,结果表明客车一类车和货车二类车有类似的时变特性 三类车、四类车和五类车有类似的时变特性。这是因为一类车和二类车一般是私家车出行, 其总量占据了车流量总量的80%,故其车流量时变特性在总体趋势上与车流总量时变特性相 似。三类车、四类车和五类车属于长途客运和货运,这几类车辆的出行则受到工作班次的约 束,故其特性曲线反应出了客运和货运的需求规律。 一类车 0.06 0.04 0.02 0 (a)客车一类车的交通量时变系数曲线 二类车 0.1 0.06 0.02 (b)货车二类车交通量时变系数曲线 图2客车一类车和火车二类车的流量时变曲线 一类车和二类车为小轿车、小货车、小客车和小面包车,其出行特点符合人们正常出行 特点,在图上体现为由两个波峰,高峰期集中在8:0-1000和15:00-18:00:而在夜间21:00-500 则表现交通流量仅占日流量的10%左右。 各车型约在4:00时所占比例最小,之后呈现增长状态,至8:00左右达到最大值,并保 持其值波动变化至18:00左右(约在13:00~15:00数值稍低),之后开始下降,一直下 降到400的状态。 (c)1994-2019ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp://www.cnki.net
对不同车型的 λ 进行统计分析,以时间为横轴,以该车型在总流量中所占比例为纵轴绘 制各个车型的交通量时变系数曲线,结果表明客车一类车和货车二类车有类似的时变特性, 三类车、四类车和五类车有类似的时变特性。这是因为一类车和二类车一般是私家车出行, 其总量占据了车流量总量的 80%,故其车流量时变特性在总体趋势上与车流总量时变特性相 似。三类车、四类车和五类车属于长途客运和货运,这几类车辆的出行则受到工作班次的约 束,故其特性曲线反应出了客运和货运的需求规律。 (a)客车一类车的交通量时变系数曲线 (b)货车二类车交通量时变系数曲线 图 2 客车一类车和火车二类车的流量时变曲线 一类车和二类车为小轿车、小货车、小客车和小面包车,其出行特点符合人们正常出行 特点,在图上体现为由两个波峰,高峰期集中在 8:0-10:00 和 15:00-18:00;而在夜间 21:00-5:00 则表现交通流量仅占日流量的 10%左右。 各车型约在 4:00 时所占比例最小,之后呈现增长状态,至 8:00 左右达到最大值,并保 持其值波动变化至 18:00 左右(约在 13:00~15:00 数值稍低),之后开始下降,一直下 降到 4:00 的状态