第15卷第4期 智能系统学报 Vol.15 No.4 2020年7月 CAAI Transactions on Intelligent Systems Jul.2020 D0L:10.11992tis.201910002 基于路网结构的城市交通事故短期风险预测方法 张延孔,卢家品',张帅超2,姬晓鹏2,罗月童',陈为 (1.合肥工业大学计算机与信息学院,安徽合肥230000,2.浙江大学计算机科学与技术学院,浙江杭州 310018) 摘要:城市交通事故一般都发生在公共道路上,然而现有的交通事故风险预测算法都通过对预测区域进行规 则网格化来确定预测空间单位,导致预测精度不高且实用价值较低。本文将道路路段作为预测单位,采用图卷 积和长短期记忆网络,构建了一种基于路网结构的城市交通事故短期风险预测方法(traffic accidents risk predic- tion based on road network,TARPBRN)。该方法能对指定路段短期内的交通事故风险进行预测,从而可以有针对 性地进行治理,诚少交通事故的发生。本文使用杭州市西湖区的交通事故数据对模型进行了训练,并与4种常 用的计量经济学模型和3种已有的深度学习预测算法进行了对比。实验结果证明本文算法在准确度、正确率 和漏报率等方面都优于已有算法。 关键词:图卷积:交通事故:事故模式:多源数据:风险预测:路网结构:长短期记忆网络:智慧城市 中图分类号:TP18文献标志码:A文章编号:1673-4785(2020)04-0663-09 中文引用格式:张延孔,卢家品,张帅超,等.基于路网结构的城市交通事故短期风险预测方法J.智能系统学报,2020, 15(4):663-671. 英文引用格式:ZHANG Yankong,LUJiapin,ZHANG Shuaichao,.etal.A short--term risk prediction method for urban traffic acci- dents based on road network[Jl.CAAI transactions on intelligent systems,2020,15(4):663-671. A short-term risk prediction method for urban traffic accidents based on road network ZHANG Yankong',LU Jiapin',ZHANG Shuaichao,JI Xiaopeng',LUO Yuetong',CHEN Wei? (1.School of Computer Science and Information Engineering,Hefei University of Technology,Hefei 230000,China;2.College of Computer Science and Technology,Zhejiang University,Hangzhou 310018,China) Abstract:Urban traffic accidents usually occur on public roads.However,the existing traffic accident risk prediction al- gorithms determine the prediction space unit by regularizing grid of the prediction area,which leads to low prediction accuracy and low practicability.Taking road sections as the prediction unit,this paper constructs a short-term traffic ac- cident risk prediction method based on road network structure(TARPBRN)by using graph convolution and long short- term memory network.This method can predict the traffic accident risk in a short period of the designated section,so as to carry out targeted governance and reduce the occurrence of traffic accidents.In this paper,traffic accident data from Xihu District,Hangzhou city are used to train the model,and four econometric models and three existing deep learning prediction algorithms are compared.The experimental results show that the proposed algorithm is superior to the exist- ing ones in accuracy,precision and false negative rate (FNR). Keywords:GCNN;traffic accident;accident mode;multi-source data;risk forecasting;road network structure;LSTM; smart city 世界卫生组织在2015年发表的《全球道路 收稿日期:2019-10-08. 基金项目:国家自然科学基金项目(61602146):浙江大学 安全状况报告》四中指出每年约有125万人死于 CAD&CG国家重点实验室开放课题(A1814):中央 交通事故。通过交通大数据,识别交通事故中的 高校基本科研业务费专项(75104-036002). 通信作者:张延孔.E-mail:zhangyankong@hfut.edu.cm. 规律并加以治理和预防已成为交通领域重要的研
DOI: 10.11992/tis.201910002 基于路网结构的城市交通事故短期风险预测方法 张延孔1 ,卢家品1 ,张帅超2 ,姬晓鹏2 ,罗月童1 ,陈为2 (1. 合肥工业大学 计算机与信息学院,安徽 合肥 230000; 2. 浙江大学 计算机科学与技术学院,浙江 杭州 310018) 摘 要:城市交通事故一般都发生在公共道路上,然而现有的交通事故风险预测算法都通过对预测区域进行规 则网格化来确定预测空间单位,导致预测精度不高且实用价值较低。本文将道路路段作为预测单位,采用图卷 积和长短期记忆网络,构建了一种基于路网结构的城市交通事故短期风险预测方法 (traffic accidents risk prediction based on road network,TARPBRN)。该方法能对指定路段短期内的交通事故风险进行预测,从而可以有针对 性地进行治理,减少交通事故的发生。本文使用杭州市西湖区的交通事故数据对模型进行了训练,并与 4 种常 用的计量经济学模型和 3 种已有的深度学习预测算法进行了对比。实验结果证明本文算法在准确度、正确率 和漏报率等方面都优于已有算法。 关键词:图卷积;交通事故;事故模式;多源数据;风险预测;路网结构;长短期记忆网络;智慧城市 中图分类号:TP18 文献标志码:A 文章编号:1673−4785(2020)04−0663−09 中文引用格式:张延孔, 卢家品, 张帅超, 等. 基于路网结构的城市交通事故短期风险预测方法 [J]. 智能系统学报, 2020, 15(4): 663–671. 英文引用格式:ZHANG Yankong, LU Jiapin, ZHANG Shuaichao, et al. A short-term risk prediction method for urban traffic accidents based on road network[J]. CAAI transactions on intelligent systems, 2020, 15(4): 663–671. A short-term risk prediction method for urban traffic accidents based on road network ZHANG Yankong1 ,LU Jiapin1 ,ZHANG Shuaichao2 ,JI Xiaopeng2 ,LUO Yuetong1 ,CHEN Wei2 (1. School of Computer Science and Information Engineering, Hefei University of Technology, Hefei 230000, China; 2. College of Computer Science and Technology, Zhejiang University, Hangzhou 310018, China) Abstract: Urban traffic accidents usually occur on public roads. However, the existing traffic accident risk prediction algorithms determine the prediction space unit by regularizing grid of the prediction area, which leads to low prediction accuracy and low practicability. Taking road sections as the prediction unit, this paper constructs a short-term traffic accident risk prediction method based on road network structure (TARPBRN) by using graph convolution and long shortterm memory network. This method can predict the traffic accident risk in a short period of the designated section, so as to carry out targeted governance and reduce the occurrence of traffic accidents. In this paper, traffic accident data from Xihu District, Hangzhou city are used to train the model, and four econometric models and three existing deep learning prediction algorithms are compared. The experimental results show that the proposed algorithm is superior to the existing ones in accuracy, precision and false negative rate (FNR). Keywords: GCNN; traffic accident; accident mode; multi-source data; risk forecasting; road network structure; LSTM; smart city 世界卫生组织在 2015 年发表的《全球道路 安全状况报告》[1] 中指出每年约有 125 万人死于 交通事故。通过交通大数据,识别交通事故中的 规律并加以治理和预防已成为交通领域重要的研 收稿日期:2019−10−08. 基金项目:国家自然科学基金项 目 (61602146);浙江大 学 CAD&CG 国家重点实验室开放课题 (A1814);中央 高校基本科研业务费专项 (75104-036002). 通信作者:张延孔. E-mail:zhangyankong@hfut.edu.cn. 第 15 卷第 4 期 智 能 系 统 学 报 Vol.15 No.4 2020 年 7 月 CAAI Transactions on Intelligent Systems Jul. 2020
·664· 智能系统学报 第15卷 究课题。 故短期风险预测算法。该算法以真实路段而不是 建立有效的交通事故风险预测系统是交通事 规则网格作为空间预测单位,使用深度学习技术 故预防的关键。如果某一区域的交通事故发生风 预测真实路段在短期内的事故风险,完成了逐天 险是可以预测的,就可以将这一信息传播给附近 和逐小时的交通事故风险预测任务。 的司机,提醒他们选择一条不那么危险的道路; 路网是一个复杂的不规则网络,CNN等处理 交警部门也可以在该区域有针对性地安排巡逻人 规则化数据的深度学习方法无法提取复杂网络的 员,达到减少事故发生的目的。然而交通事故发 局部特征,因此本文引入图卷积神经网络(graph 生风险的准确预测是非常困难的,交通事故的诱 convolutional neural networks,GCNN)模型来计算 发因素多种多样,大致可以分为人、车、路和环境 路网结构的局部特征。GCNN可以处理不规则的 四大类引,其中人的因素是首要因素。人的行为 网络数据,在深度学习领域得到了广泛的应用 主观性较强,不可预测,导致虽然许多研究人 在预测模型方面,2018年,Lin等2o1将GCNN和 已经把注意力集中在交通事故相关的关键因素识 LSTM结合用于纽约市共享单车站点每小时单车 别上,交通事故风险的有效预测仍然是一个具有 需求量的预测,取得良好的效果。 挑战性的问题。 与迭代神经网络(recurrent neural network, 在过去,针对交通事故预测的研究主要聚焦 RNN)相比,长短期记忆网络(long short-.term 在粗粒度、宏观方面上的研究。研究空间粒度精 memory network,LSTM因其可以进行长时间预 度聚焦在省、市层次,时间粒度聚焦在年、月份层 测的特点而在时序数据预测中广泛使用。但 次41。因此研究成果的针对性不高,实用性较 LSTM在处理超长序列时会导致训练时间大大增 差,仅能提供参考性意见。近年来,随着大数据 长,同时在超长的序列中进行反向传播也可能会 和深度学习技术的发展9,交通事故的短期实时 导致梯度消失,从而削弱模型的可靠性。本文结 预测成为了可能。2016年,Chen等u通过Stack 合交通事故的时序特征,设计了双链LSTM(double 去噪自动编码器来提取人的移动特征构建深度学 link LSTM.DLSTM),处理交通事故风险预测中超 习网络来预测日本境内交通事故风险,2018年, 长输入的问题,取得了较好的效果。 RenI综合考虑交通事故的周期性和空间分布模 综上所述,本文的主要贡献有以下几点: 1)提出基于路网结构、以真实路段作为空间 式并结合其他重要因素如天气、空气质量等,采 预测单元,逐日、逐小时对城市交通事故短期风 用LSTM模型,构建了短期北京市的交通事故风 险进行预测,提高了预测结果的准确性和实际应 险预测系统。以上方法都对预测区域进行规则 用价值。 化网格划分,针对每一个网格统计其数据特征, 2)采用深度学习技术构建了基于路网的城市 预测网格区域短期事故发生风险。2018年,Bao 短期交通事故风险预测模型。在模型中使用 等)在划分的网格的基础上,利用卷积神经网络 GCNN提取交通事故预测属性的空间特征,使用 (convolutional neural networks,CNN)来计算网格的 优化后的DLSTM提取预测属性的时间特征,并 局部区域特征,从而得到了更好的预测效果。 将两者结合提取其时空特征。 但这些基于网格划分的交通事故短期预测 3)利用杭州市的多源交通数据对模型进行了 方法,将规则化网格作为预测的空间单位,这些 训练,并与已有的计量经济学模型和深度学习模 网格内包含大量的非道路区域,如居民区、商场 型进行了对比,实验证明本文算法在准确度、正 区等。非道路区域通常不会有交通事故的发生, 确率和漏报率上均优于已有算法。 这在一定情况下影响了预测的准确度。交警在 1多源交通数据及预处理 进行巡逻、救援等执勤任务时都以路段为单位进 行划分,划分网格的预测结果只能在任务分配时 1.1多源交通数据 提供一定程度的参考;以网格作为交通事故风险 本文采用浙江省杭州市西湖区总共5类与交 预测单位也不能满足司机根据事故发生风险来 通有关的数据进行交通事故风险的短期预测。 选择行进路线的需求。因此基于划分网格的短 交通事故数据交通事故数据由杭州市交警 期交通事故预测方法准确度普遍不高且实用价 支队提供,数据时间跨度为2015年7月11日一 值较低。 2015年12月21日。交通事故数据主要包括交通 因此,本文提出基于路网结构的城市交通事 事故发生的时间和位置信息,格式如表1所示
究课题。 建立有效的交通事故风险预测系统是交通事 故预防的关键。如果某一区域的交通事故发生风 险是可以预测的,就可以将这一信息传播给附近 的司机,提醒他们选择一条不那么危险的道路; 交警部门也可以在该区域有针对性地安排巡逻人 员,达到减少事故发生的目的。然而交通事故发 生风险的准确预测是非常困难的,交通事故的诱 发因素多种多样,大致可以分为人、车、路和环境 四大类[2-3] ,其中人的因素是首要因素。人的行为 主观性较强,不可预测,导致虽然许多研究人员 已经把注意力集中在交通事故相关的关键因素识 别上,交通事故风险的有效预测仍然是一个具有 挑战性的问题。 在过去,针对交通事故预测的研究主要聚焦 在粗粒度、宏观方面上的研究。研究空间粒度精 度聚焦在省、市层次,时间粒度聚焦在年、月份层 次 [4-8]。因此研究成果的针对性不高,实用性较 差,仅能提供参考性意见。近年来,随着大数据 和深度学习技术的发展[9-14] ,交通事故的短期实时 预测成为了可能。2016 年,Chen 等 [15] 通过 Stack 去噪自动编码器来提取人的移动特征构建深度学 习网络来预测日本境内交通事故风险; 2018 年, Ren[16] 综合考虑交通事故的周期性和空间分布模 式并结合其他重要因素如天气、空气质量等,采 用 LSTM 模型,构建了短期北京市的交通事故风 险预测系统。以上方法都对预测区域进行规则 化网格划分,针对每一个网格统计其数据特征, 预测网格区域短期事故发生风险。2018 年,Bao 等 [17] 在划分的网格的基础上,利用卷积神经网络 (convolutional neural networks, CNN) 来计算网格的 局部区域特征,从而得到了更好的预测效果。 但这些基于网格划分的交通事故短期预测 方法,将规则化网格作为预测的空间单位,这些 网格内包含大量的非道路区域,如居民区、商场 区等。非道路区域通常不会有交通事故的发生, 这在一定情况下影响了预测的准确度。交警在 进行巡逻、救援等执勤任务时都以路段为单位进 行划分,划分网格的预测结果只能在任务分配时 提供一定程度的参考;以网格作为交通事故风险 预测单位也不能满足司机根据事故发生风险来 选择行进路线的需求。因此基于划分网格的短 期交通事故预测方法准确度普遍不高且实用价 值较低。 因此,本文提出基于路网结构的城市交通事 故短期风险预测算法。该算法以真实路段而不是 规则网格作为空间预测单位,使用深度学习技术 预测真实路段在短期内的事故风险,完成了逐天 和逐小时的交通事故风险预测任务。 路网是一个复杂的不规则网络,CNN 等处理 规则化数据的深度学习方法无法提取复杂网络的 局部特征,因此本文引入图卷积神经网络 (graph convolutional neural networks, GCNN) 模型来计算 路网结构的局部特征。GCNN 可以处理不规则的 网络数据,在深度学习领域得到了广泛的应用[18-20]。 在预测模型方面,2018 年,Lin 等 [20] 将 GCNN 和 LSTM 结合用于纽约市共享单车站点每小时单车 需求量的预测,取得良好的效果。 与迭代神经网络 (recurrent neural network, RNN) 相比,长短期记忆网络 (long short-term memory network, LSTM) 因其可以进行长时间预 测的特点而在时序数据预测中广泛使用。但 LSTM 在处理超长序列时会导致训练时间大大增 长,同时在超长的序列中进行反向传播也可能会 导致梯度消失,从而削弱模型的可靠性。本文结 合交通事故的时序特征,设计了双链 LSTM(double link LSTM, DLSTM),处理交通事故风险预测中超 长输入的问题,取得了较好的效果。 综上所述,本文的主要贡献有以下几点: 1) 提出基于路网结构、以真实路段作为空间 预测单元,逐日、逐小时对城市交通事故短期风 险进行预测,提高了预测结果的准确性和实际应 用价值。 2) 采用深度学习技术构建了基于路网的城市 短期交通事故风险预测模型。在模型中使用 GCNN 提取交通事故预测属性的空间特征,使用 优化后的 DLSTM 提取预测属性的时间特征,并 将两者结合提取其时空特征。 3) 利用杭州市的多源交通数据对模型进行了 训练,并与已有的计量经济学模型和深度学习模 型进行了对比,实验证明本文算法在准确度、正 确率和漏报率上均优于已有算法。 1 多源交通数据及预处理 1.1 多源交通数据 本文采用浙江省杭州市西湖区总共 5 类与交 通有关的数据进行交通事故风险的短期预测。 交通事故数据 交通事故数据由杭州市交警 支队提供,数据时间跨度为 2015 年 7 月 11 日— 2015 年 12 月 21 日。交通事故数据主要包括交通 事故发生的时间和位置信息,格式如表 1 所示。 ·664· 智 能 系 统 学 报 第 15 卷
第4期 张延孔,等:基于路网结构的城市交通事故短期风险预测方法 ·665· 表1交通事故数据格式 表4微波检测器检测数据格式 Table 1 Traffic accident data format Table 4 Microwave detector detection data format 字段名 内容介绍 格式示例 字段名 内容介绍 格式示例 D 事故编号 2015071100060612 发生时间 D 检测记录编号 283706900 Time 2015-07-1100:06:06 ADDR 发生地点 环城北路杭州大厦 WavelD 微波检测器编号 890 Coord x 发生经度 120.161984 Totalflow 5秒内车辆数量 6 Coord y 发生纬度 30.272192 Speed 5秒内车辆平均速度 30 两车刮擦.公交车逃逸。 Content 事故描述 Collectdate 记录时间 2015-07-1200:00:00 现双方在武林广场处 出租车轨迹数据本文使用的出租车轨迹 路网结构数据本文所使用路网结构数据 数据来自于杭州市出租车公司。时间跨度为2015年 从OpenStreetMap网站下载,并经过简化处理获 6月22日一6月30日,为期9天的数据。因为数 得,其数据格式如表2所示。路网结构数据中记 录各个道路路段的关键节点的经纬度坐标,及该 据时间跨度很小,故本文未将其用作预测交通 路段邻接路段的编号。 事故风险的属性信息,只将其作为构建路网图 结构的支撑数据。出租车轨迹数据的格式如表5 表2路网结构数据格式 Table 2 Road network structure data format 所示。 字段名 内容介绍 格式示例 表5出租车轨迹数据格式 D 路段ID 13 Table 5 Taxi trajectory data format XIng 路段起点经度 120.161984 字段名 内容介绍 格式示例 Xlat 路段起点纬度 30.272192 ID 出租车记录D 15 YIng 路段终点经度 120.161984 Date 发生时间 2015-06-2223:59:00 Ylat 路段终点纬度 30.272192 City 所属城市 HZ Way 路段所属道路名 秋石高架 与该路段相邻的所有 carID 出租车牌号 75636 neiborID 13,1645 路段id,用“,”隔开 Lng 出租车所在位置经度 120.171984 Distance 路段长度 130.134 Lat 出租车所在道路纬度 30.272192 Type 所属区域类型 商业区 Speed 出租车速度 42 Level 道路等级 一级公路 Angel 出租车前轮角度 60 flow num 车道数 三车道 Isfull 出租车是否载客 1 道路微波检测数据道路微波检测数据由杭 天气数据 本文所使用的数据由爬虫从天气 州市交警支队提供,数据时间跨度同交通事故数 据一致,为2015年7月11日一12月21日。 后报网(htp:www.tianqihoubao.com)爬取获得, 微波检测数据由两部分构成:微波检测器分布数 天气数据的时间跨度为2015年7月11日一12 据和微波检测器输出数据。微波检测器分布数据 月21日,同交通事故数据一致,天气数据的主要 如表3所示。 格式如表6所示。 表3微波检测器分布数据格式 表6天气数据格式 Table 3 Microwave detector distributed data format Table 6 Weather data format 字段名 内容介绍 格式示例 字段名 格式介绍 示例 ID 微波检测器编号 23 Province 省 浙江 Name 位置描述 庆春路秋涛路西口 City 城市 杭州 Lng 微波检测器位置经度 120.194988 Date 日期 微波检测器位置纬度 2015-06-22 Lat 30.252766 微波检测器每5s记录一次道路路况,每条记 Tainq! 白天天气、夜晚天气 晴/多云 最高气温、最低气温 30℃/25℃ 录包含该路段在5s内通过的车辆数目,以及通 Temperature 过车辆的平均速度,微波检测器检测数据格式如 北风微风/无持续 Feng 白天夜晚风力、风向 风向微风 表4所示
表 1 交通事故数据格式 Table 1 Traffic accident data format 字段名 内容介绍 格式示例 ID 事故编号 2 015071 100060 612 Time 发生时间 2015-07-11 00:06:06 ADDR 发生地点 环城北路杭州大厦 Coord_x 发生经度 120.161984 Coord_y 发生纬度 30.272192 Content 事故描述 两车刮擦,公交车逃逸, 现双方在武林广场处 路网结构数据 本文所使用路网结构数据 从 OpenStreetMap 网站下载,并经过简化处理获 得,其数据格式如表 2 所示。路网结构数据中记 录各个道路路段的关键节点的经纬度坐标,及该 路段邻接路段的编号。 表 2 路网结构数据格式 Table 2 Road network structure data format 字段名 内容介绍 格式示例 ID 路段ID 13 Xlng 路段起点经度 120.161 984 Xlat 路段起点纬度 30.272 192 Ylng 路段终点经度 120.161 984 Ylat 路段终点纬度 30.272 192 Way 路段所属道路名 秋石高架 neiborID 与该路段相邻的所有 路段id,用“,”隔开 13,16,45 Distance 路段长度 130.134 Type 所属区域类型 商业区 Level 道路等级 一级公路 flow_num 车道数 三车道 道路微波检测数据 道路微波检测数据由杭 州市交警支队提供,数据时间跨度同交通事故数 据一致, 为 2015 年 7 月 11 日 — 1 2 月 21 日 。 微波检测数据由两部分构成:微波检测器分布数 据和微波检测器输出数据。微波检测器分布数据 如表 3 所示。 表 3 微波检测器分布数据格式 Table 3 Microwave detector distributed data format 字段名 内容介绍 格式示例 ID 微波检测器编号 23 Name 位置描述 庆春路秋涛路西口 Lng 微波检测器位置经度 120.194 988 Lat 微波检测器位置纬度 30.252 766 微波检测器每 5 s 记录一次道路路况,每条记 录包含该路段在 5 s 内通过的车辆数目,以及通 过车辆的平均速度,微波检测器检测数据格式如 表 4 所示。 表 4 微波检测器检测数据格式 Table 4 Microwave detector detection data format 字段名 内容介绍 格式示例 ID 检测记录编号 283706 900 WaveID 微波检测器编号 890 Totalflow 5秒内车辆数量 6 Speed 5秒内车辆平均速度 30 Collectdate 记录时间 2015-07-12 00:00:00 出租车轨迹数据 本文使用的出租车轨迹 数据来自于杭州市出租车公司。时间跨度为 2015 年 6 月 22 日—6 月 30 日,为期 9 天的数据。因为数 据时间跨度很小,故本文未将其用作预测交通 事故风险的属性信息,只将其作为构建路网图 结构的支撑数据。出租车轨迹数据的格式如表 5 所示。 表 5 出租车轨迹数据格式 Table 5 Taxi trajectory data format 字段名 内容介绍 格式示例 ID 出租车记录ID 15 Date 发生时间 2015-06-22 23:59:00 City 所属城市 HZ carID 出租车牌号 75636 Lng 出租车所在位置经度 120.171 984 Lat 出租车所在道路纬度 30.272 192 Speed 出租车速度 42 Angel 出租车前轮角度 60 Isfull 出租车是否载客 1 天气数据 本文所使用的数据由爬虫从天气 后报网 (http://www.tianqihoubao.com/) 爬取获得, 天气数据的时间跨度为 2015 年 7 月 11 日—12 月 21 日,同交通事故数据一致,天气数据的主要 格式如表 6 所示。 表 6 天气数据格式 Table 6 Weather data format 字段名 格式介绍 示例 Province 省 浙江 City 城市 杭州 Date 日期 2015-06-22 Tainqi 白天天气、夜晚天气 晴/多云 Temperature 最高气温、最低气温 30 ℃/ 25 ℃ Feng 白天夜晚风力、风向 北风 微风 /无持续 风向 微风 第 4 期 张延孔,等:基于路网结构的城市交通事故短期风险预测方法 ·665·
·666· 智能系统学报 第15卷 1.2数据预处理 观察数据可知,以上数据数值范围都不统一, 本文提出的基于路网结构的城市交通事故短 因此并不能直接作为神经网络的输入。因此针对 期风险预测算法以真实路段作为空间预测单元, 于所有的枚举类特征,例如天气、风向、道路所属 因此使用的所有属性特征应该按照路段进行划 区域等,本文采用one-hot编码。对于所有的数值 分。由21节可知,所有数据的位置信息以经纬 型特征,本文统计最大值、最小值,然后根据最大 度来描述,因此首先要将经纬度所代表信息绑定 最小值将其映射到区间0,1]。于是所有的特征值 到相应路段。假设预测路段集合为S,待绑定的 都处在[0,1]区间内,使得深度学习框架能获得良 位置为Pgsn,位置与路段绑定的算法如下。 好的效果。 1)针对于路段集合S中第i条路段,其长度 在此说明,本文仅对输入特征数据进行量纲 为l,位置Pg与其起点和终点的距离分别为 统一处理,对于预测结果,本文使用单位时间内 d-ai、d-ed,距离采用欧几里德距离公式计算,则 事故发生的次数并没有映射到区间0,],这也与 可得路段差值d,=d-tsmi+d-end-ho 已有算法的交通事故风险描述一致。 2)寻找路段m使得dm为所有路段差值的最 2交通事故预测深度学习模型 小值。 3)定义阈值8,若dm小于阈值8,则该位置与 本节首先详细地描述了基于路网的交通事故 路段m绑定;若dm不小于阈值ε,则该位置与预测 风险预测模型(traffic accidents risk prediction based 集合中的任何路段都不绑定。 on road network,TARPBRN)的总体架构,然后分 根据以上位置点与路段的绑定算法,可以将 别对每个主要模块进行了具体介绍。 交通事故、微波检测器及出租车位置信息绑定到 2.1 TARPBRN模型架构 相应路段。从而可得路段在预测交通事故时的所 由1.2节可知,本文将交通事故的诱发因素 有属性特征。本文将路段属性数据分为3类:空 从数据特征出发主要分为三大类:时间相关特 间相关数据、时间相关数据、时空相关数据。 征、空间相关特征和时空相关特征,针对每一类 空间相关数据仅与路段相关的特征,对于 特征,分别采用不同的网络结构进行特征提取。 任意时间段数据值都一样。该类数据有路段长 TARPBRN模型的总体架构如图1所示。首先, 度、道路等级、车道数、道路所属区域等。 对3类属性数据进行特征提取操作。对于空间相 时间相关数据仅与时间段相关联的数据, 关数据,本文使用多层GCNN来提取空间特征。 对于所有的路段数据值都一样。该类特征有天 对于时间相关数据采用DLSTM提取时间特征。 气、风力、风向、气温等。 对于时空相关数据,本文将GCNN和DLSTM相 时空相关数据是与时间段、路段都有关联 结合来提取时空特征。然后,将3类属性数据通 的数据。同一路段在不同时间、不同路段在相同 过相应特征提取层获得的特征传入特征融合层, 时间都具有不同的数据值。该类数据有单位时间 将3类属性特征融合为一个整体。最后,将融合 道路通过车辆数、单位时间道路车辆通过平均速 后的特征传入全连接网络,通过全连接网络输出 度、单位时间内事故发生数量等。 最终的预测结果。 空间相关数据 多层GCNN层 时间相关数据 征融合层 全 DLSTM 接层 结果 时空相关特征 GCNN+DLSTM 图1交通事故风险预测框架 Fig.1 Traffic accident risk prediction framework 2.2多层GCNN层提取空间属性特征 法,在对图进行卷积神经网络学习时,可以同时 GCNN是一种能对图数据进行深度学习的方 考虑到节点的特征信息以及结构信息。这使得
1.2 数据预处理 P(lng,lat) 本文提出的基于路网结构的城市交通事故短 期风险预测算法以真实路段作为空间预测单元, 因此使用的所有属性特征应该按照路段进行划 分。由 2.1 节可知,所有数据的位置信息以经纬 度来描述,因此首先要将经纬度所代表信息绑定 到相应路段。假设预测路段集合为 S,待绑定的 位置为 ,位置与路段绑定的算法如下。 i li P(lng,lat) di−start di−end di = di−start +di−end −li 1) 针对于路段集合 S 中第 条路段,其长度 为 ,位置 与其起点和终点的距离分别为 、 ,距离采用欧几里德距离公式计算,则 可得路段差值 。 2) 寻找路段 m 使得 dm 为所有路段差值的最 小值。 ε dm ε dm ε 3) 定义阈值 ,若 小于阈值 ,则该位置与 路段 m 绑定;若 不小于阈值 ,则该位置与预测 集合中的任何路段都不绑定。 根据以上位置点与路段的绑定算法,可以将 交通事故、微波检测器及出租车位置信息绑定到 相应路段。从而可得路段在预测交通事故时的所 有属性特征。本文将路段属性数据分为 3 类:空 间相关数据、时间相关数据、时空相关数据。 空间相关数据 仅与路段相关的特征,对于 任意时间段数据值都一样。该类数据有路段长 度、道路等级、车道数、道路所属区域等。 时间相关数据 仅与时间段相关联的数据, 对于所有的路段数据值都一样。该类特征有天 气、风力、风向、气温等。 时空相关数据 是与时间段、路段都有关联 的数据。同一路段在不同时间、不同路段在相同 时间都具有不同的数据值。该类数据有单位时间 道路通过车辆数、单位时间道路车辆通过平均速 度、单位时间内事故发生数量等。 [0,1] [0,1] 观察数据可知,以上数据数值范围都不统一, 因此并不能直接作为神经网络的输入。因此针对 于所有的枚举类特征,例如天气、风向、道路所属 区域等,本文采用 one-hot 编码。对于所有的数值 型特征,本文统计最大值、最小值,然后根据最大 最小值将其映射到区间 。于是所有的特征值 都处在 区间内,使得深度学习框架能获得良 好的效果。 [0,1] 在此说明,本文仅对输入特征数据进行量纲 统一处理,对于预测结果,本文使用单位时间内 事故发生的次数并没有映射到区间 ,这也与 已有算法的交通事故风险描述一致。 2 交通事故预测深度学习模型 本节首先详细地描述了基于路网的交通事故 风险预测模型 (traffic accidents risk prediction based on road network, TARPBRN) 的总体架构,然后分 别对每个主要模块进行了具体介绍。 2.1 TARPBRN 模型架构 由 1.2 节可知,本文将交通事故的诱发因素 从数据特征出发主要分为三大类:时间相关特 征、空间相关特征和时空相关特征,针对每一类 特征,分别采用不同的网络结构进行特征提取。 TARPBRN 模型的总体架构如图 1 所示。首先, 对 3 类属性数据进行特征提取操作。对于空间相 关数据,本文使用多层 GCNN 来提取空间特征。 对于时间相关数据采用 DLSTM 提取时间特征。 对于时空相关数据,本文将 GCNN 和 DLSTM 相 结合来提取时空特征。然后,将 3 类属性数据通 过相应特征提取层获得的特征传入特征融合层, 将 3 类属性特征融合为一个整体。最后,将融合 后的特征传入全连接网络,通过全连接网络输出 最终的预测结果。 空间相关数据 时间相关数据 时空相关特征 多层 GCNN 层 DLSTM GCNN+DLSTM 特征融合层 全连接层 预测 结果 图 1 交通事故风险预测框架 Fig. 1 Traffic accident risk prediction framework 2.2 多层 GCNN 层提取空间属性特征 GCNN 是一种能对图数据进行深度学习的方 法,在对图进行卷积神经网络学习时,可以同时 考虑到节点的特征信息以及结构信息。这使得 ·666· 智 能 系 统 学 报 第 15 卷
第4期 张延孔,等:基于路网结构的城市交通事故短期风险预测方法 ·667· GCNN广泛用于非规则数据的深度学习。图卷积 该数据来描述相邻路段的关联度,在相邻路段间 网络的主要计算方式如下: 经过的次数越多,相邻路段之间的关联度越高, 给定图G=(V,x,8,A),V是N个顶点的集 转换公式为 合,x∈R是每一个顶点特征向量的集合。ε是边 f(x)=lgx/lgmax 的结合,A是邻接矩阵,其中A表示两个顶点间 式中:x为车辆在相邻路段经过的次数;max为车 的关联度。假设GCNN模型从输入层到输出层 辆在相邻路段经过次数的最大值;fx)即为转化 共有m层。图网络中的每一个顶点在1层中都有 后的关联度。 一个长度为C的特征向量。对于每一层10=1,2,…, 2.3 DLSTM层提取时间特征 m-1),图卷积模型GCNN以如下的规则从输入层 长短期记忆(long short-term memory, 到输出层进行传播: LSTM)是一种特殊的RNN,相比普通的RNN, H=o(D-AD-H-W) LSTM能够在长序列数据中有更好的表现,它在 其中D是一个对角矩阵,Da=∑A),W1 ERCHxC 算法中加入了一个判断信息有用与否的结构单 是每一层可训练的权重矩阵,σ(.)是一个激活函 元。如图3所示,结构单元中被放置了3扇门,即 数,HIE RNxC是第I层的激活输出矩阵。H-I∈Rxc 输入门、遗忘门和输出门。当一个信息进入LSTM 则是第1-1层的激活输出矩阵。对于第1层输 的网络当中,可以根据规则来判断是否有用,实 入层: 现信息的选择性通过。LSTM更细节的信息可以 H=(D-:AD-HW) 参考文献[23] H即是图网络结构中各顶点的输入特征x。 综上可知,图卷积进行特征提取是需要输入 两部分数据,图的邻接矩阵A及特征属性数据 输人门( 输出门(O, x。特征属性数据x由第2节经过数据预处理已 经获得,图的邻接矩阵可由路网结构转化得到。 记忆单元 本文以路段作为空间预测单元,路段在路网 结构中通常以边的形式存在,而GCNN模型主要 计算图结构的顶点特征。因此本文首先要将路网 遗忘门 中的路段转化为图结构中的顶点,将路网中的交 叉点转化为边。转化方式如图2所示。 小 图3LSTM结构单元 Fig.3 LSTM structural unit ●中 B司 虽然通过LSTM可以获取长期记忆的特征, 但LSTM在处理超长序列时会导致训练时间大大 C 增长,同时在超长的序列中进行反向传播也可能 会导致梯度消失,从而削弱模型的可靠性。部分 (a)路网结构 b)图结构 情况下,还可能因为冗余信息太多,无法取得良 图2路网转化为图结构示意 好效果。 Fig.2 Road network transformation into graph structure 因此,基于交通事故在时序上呈现的周期性 sketch 和渐近性的特征,本文提出了双链LSTM(DLSTM) 图2(a)中有3条路段A、B、C交汇于一点,当 网络。如图4所示。假设预测1时刻的时序特征 该路网结构转化为图结构时,A、B、C路段转化 (假设序列的周期性为5),则提取t-1、t-2、t-3、 为3个顶点,如图2(b)所示。路段A可通过交汇 -4时刻的特征(图中蓝色区域特征)作为渐近特 点到达B,因此图结构中,顶点A与顶点B之间有 征。提取t-5、1-2×5、t-3×5、1-4×5时刻的特 边相连,同理,顶点A、B,顶点B、C之间都有边相连。 征(图中绿色区域的特征作为周期特征)。然后将 将路网结构转化为图结构后就可以得出路网 渐近特征和周期特征分别传入LSTM网络,最后 结构的邻接矩阵,但此时邻接矩阵的只有0、1两 将两个LSTM链中的特征进行融合,作为DLSM 个数值。0表示不连接,1表示连接。为了更明确 网络的输出特征。注意这里因为两种特征同属于 地表示相邻路段之间的关联度,本文根据出租车 多层LSTM层输出的时序特征,相互之间影响较 轨迹数据,计算出租车经过相邻路段的次数,用 大,故以相乘的方式进行特征融合
GCNN 广泛用于非规则数据的深度学习。图卷积 网络的主要计算方式如下: G = (V, x,ε, A) V x ∈ R N ε Ai j l C l l(l = 1,2,··· , m−1) 给定图 , 是 N 个顶点的集 合, 是每一个顶点特征向量的集合。 是边 的结合,A 是邻接矩阵,其中 表示两个顶点间 的关联度。假设 GCNN 模型从输入层到输出层 共有 m 层。图网络中的每一个顶点在 层中都有 一个长度为 的特征向量。对于每一层 ,图卷积模型 GCNN 以如下的规则从输入层 到输出层进行传播: H l = σ(D − 1 2 AD− 1 2 H l−1Wl ) Dii = ∑ Ai j Wl−1 ∈ R C l−1×C l σ() Hl ∈ R N×C l l Hl−1 ∈ R N×C l−1 l−1 其中 D 是一个对角矩阵, , 是每一层可训练的权重矩阵, 是一个激活函 数, 是第 层的激活输出矩阵。 则是第 层的激活输出矩阵。对于第 1 层输 入层: H 1 = σ(D − 1 2 AD− 1 2 H 0W1 ) H0 即是图网络结构中各顶点的输入特征 x。 x x 综上可知,图卷积进行特征提取是需要输入 两部分数据,图的邻接矩阵 A 及特征属性数据 。特征属性数据 由第 2 节经过数据预处理已 经获得,图的邻接矩阵可由路网结构转化得到。 本文以路段作为空间预测单元,路段在路网 结构中通常以边的形式存在,而 GCNN 模型主要 计算图结构的顶点特征。因此本文首先要将路网 中的路段转化为图结构中的顶点,将路网中的交 叉点转化为边。转化方式如图 2 所示。 (a) 路网结构 (b) 图结构 A B A B C C 图 2 路网转化为图结构示意 Fig. 2 Road network transformation into graph structure sketch 图 2(a) 中有 3 条路段 A、B、C 交汇于一点,当 该路网结构转化为图结构时,A、B、C 路段转化 为 3 个顶点,如图 2(b) 所示。路段 A 可通过交汇 点到达 B,因此图结构中,顶点 A 与顶点 B 之间有 边相连,同理,顶点 A、B,顶点 B、C 之间都有边相连。 将路网结构转化为图结构后就可以得出路网 结构的邻接矩阵,但此时邻接矩阵的只有 0、1 两 个数值。0 表示不连接,1 表示连接。为了更明确 地表示相邻路段之间的关联度,本文根据出租车 轨迹数据,计算出租车经过相邻路段的次数,用 该数据来描述相邻路段的关联度,在相邻路段间 经过的次数越多,相邻路段之间的关联度越高, 转换公式为 f(x) = lg x/ lgmax f(x) 式中:x 为车辆在相邻路段经过的次数;max 为车 辆在相邻路段经过次数的最大值; 即为转化 后的关联度。 2.3 DLSTM 层提取时间特征 长短期记 忆 (long short-term memory, LSTM) 是一种特殊的 RNN,相比普通的 RNN, LSTM 能够在长序列数据中有更好的表现,它在 算法中加入了一个判断信息有用与否的结构单 元。如图 3 所示,结构单元中被放置了 3 扇门,即 输入门、遗忘门和输出门。当一个信息进入 LSTM 的网络当中,可以根据规则来判断是否有用,实 现信息的选择性通过。LSTM 更细节的信息可以 参考文献 [23]。 输入门 xt xt ht Ot xt it 输出门 记忆单元 ct ft xt 遗忘门 图 3 LSTM 结构单元 Fig. 3 LSTM structural unit 虽然通过 LSTM 可以获取长期记忆的特征, 但 LSTM 在处理超长序列时会导致训练时间大大 增长,同时在超长的序列中进行反向传播也可能 会导致梯度消失,从而削弱模型的可靠性。部分 情况下,还可能因为冗余信息太多,无法取得良 好效果。 t−1、t−2、t−3、 t−4 t−5、t−2×5、t−3×5、t−4×5 因此,基于交通事故在时序上呈现的周期性 和渐近性的特征,本文提出了双链 LSTM(DLSTM) 网络。如图 4 所示。假设预测 t 时刻的时序特征 (假设序列的周期性为 5),则提取 时刻的特征 (图中蓝色区域特征) 作为渐近特 征。提取 时刻的特 征 (图中绿色区域的特征作为周期特征)。然后将 渐近特征和周期特征分别传入 LSTM 网络,最后 将两个 LSTM 链中的特征进行融合,作为 DLSM 网络的输出特征。注意这里因为两种特征同属于 多层 LSTM 层输出的时序特征,相互之间影响较 大,故以相乘的方式进行特征融合。 第 4 期 张延孔,等:基于路网结构的城市交通事故短期风险预测方法 ·667·