用于交通需求预测的时空地理加权回归模型及应用 周禹佳,沈辛夷,金盛 (漸江大学建筑工程学院,浙江杭州310058) 摘要:交通需求预测对交通规划具有重要作用,但当对交通需求进行预测,需同 时考虑时空因素对其造成的影响时则具有较大挑战性,本文选取时空地理加权回归 模型(GT瞅R模型〕进行预测,该模型能较好的捕捉交通需求的时空特性以及交通需 求与建成环境之间的关系,运用2016年杭州市车牌数据验证该模型的精确性,本 文运用一般最小二乘回归模型(0LS模型)、地理加权回归模型(GR模型)以及 GTwR模型分别对各个交通小区的交通需求进行预测,结果可以发现:GTwR模型在 需同时考虑时空非平稳性方面有较大优势,且就拟合度方面来说:0LS模型、GWR 模型以及θTR模型的精度分别为12.90%,51.04%以及91.85%,即GTR模型在描 述交通需求预测方面优于传统模型 关键词 交通需求预测;LS模型;GR模型;GTwR模型;时空非平稳性 中图分类号:U238 Geographically and Temporally weighted regression Model for Traffic demand Forecasting and Its application Zhouru-jia, Shen Xin-yi, Jin Sheng College of Civil Enginee ing and Architecture, Zhejiang University, Hangzhou 310058) Abstract: Traffic demand estimation is of great importance to transportation planning. Both the spatial and temporal dependences need to be considered simultaneously, which makes traffic demand estimation challenging. This paper introduces a Geographically and Temporally Weighted Regression(GTWR) model to capture the spatiotemporal characteristics of traffic demand and correlations between traffic demand and built environment. Experimental data, the license plate data in Hangzhou, 2016, is utilized to evaluate the accuracy of the GTwr model. This paper uses the global Ordinary Least Squares(OLS)model, Geographically ighted Regression(GWR)model and GTwR model to predict the traffic demand of each raffic Analysis Zone (TAZ) respectively. The results show that the GTwr model has substantial benefits in modeling both spatial and temporal non-stationarity simultaneously. In the test sample, in terms of goodness-of-fit, 12.90% of the variation in the traffic demand can be explained by the OLs model, while 51.04% by the GwR model, 91.85% by the Gtwr 通讯作者:金盛(1982—),男,浙江温州人,副教授,博士生 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
用于交通需求预测的时空地理加权回归模型及应用1 周禹佳,沈辛夷,金盛 (浙江大学建筑工程学院,浙江 杭州 310058) 摘 要: 交通需求预测对交通规划具有重要作用,但当对交通需求进行预测,需同 时考虑时空因素对其造成的影响时则具有较大挑战性,本文选取时空地理加权回归 模型(GTWR 模型)进行预测,该模型能较好的捕捉交通需求的时空特性以及交通需 求与建成环境之间的关系,运用 2016 年杭州市车牌数据验证该模型的精确性,本 文运用一般最小二乘回归模型(OLS 模型)、地理加权回归模型(GWR 模型)以及 GTWR 模型分别对各个交通小区的交通需求进行预测,结果可以发现:GTWR 模型在 需同时考虑时空非平稳性方面有较大优势,且就拟合度方面来说:OLS 模型、GWR 模型以及 GTWR 模型的精度分别为 12.90%,51.04%以及 91.85%,即 GTWR 模型在描 述交通需求预测方面优于传统模型。 关键词: 交通需求预测;OLS 模型;GWR 模型;GTWR 模型;时空非平稳性 中图分类号:U238 Geographically and Temporally Weighted Regression Model for Traffic Demand Forecasting and Its Application ZhouYu-jia, ShenXin-yi, JinSheng ( College of Civil Engineering and Architecture,Zhejiang University, Hangzhou 310058) Abstract: Traffic demand estimation is of great importance to transportation planning. Both the spatial and temporal dependences need to be considered simultaneously, which makes traffic demand estimation challenging. This paper introduces a Geographically and Temporally Weighted Regression (GTWR) model to capture the spatiotemporal characteristics of traffic demand and correlations between traffic demand and built environment. Experimental data, the license plate data in Hangzhou, 2016, is utilized to evaluate the accuracy of the GTWR model. This paper uses the global Ordinary Least Squares (OLS) model, Geographically Weighted Regression (GWR) model and GTWR model to predict the traffic demand of each Traffic Analysis Zone (TAZ) respectively. The results show that the GTWR model has substantial benefits in modeling both spatial and temporal non-stationarity simultaneously. In the test sample, in terms of goodness-of-fit, 12.90% of the variation in the traffic demand can be explained by the OLS model, while 51.04% by the GWR model, 91.85% by the GTWR 通讯作者:金盛(1982—),男,浙江温州人,副教授,博士生
model That is, the GTWR model is better than the traditional model in describing traffic demand forecasting key words: Traffic Demand Estimation, OLSModel, GWR Model, GTWR Model, Spatial and Temporal Non-Stationarity 、引言 近年来,随着机动车保有量不断增加,城市交通需求日益增长,仅挖掘现有道路的通行 能力远远不够,应结合交通规划的方法由供给端向需求端改进,对未来道路的交通需求进行 合理的预测从而为道路网规划建设提供较好的支撑,因此作为交通规划理论核心的交通需求 预测,其预测模型的准确度直接影响交通需求预测结果,选择能够较好的指导城市交通规划 实践的交通需求预测模型至关重要 在过去的几年里已经吸引较多的学者研究交通需求预测模型,例如:四阶段法、时间序 列法等。以往的方法较少考虑建成环境对于交通需求的影响,但众所周知,交通小区土地利 用密度及混合使用对其交通需求量具有较大影响,以往有关的研究均说明该种现象:首先在 土地利用密度方面:在考虑了家庭小汽车拥有量及收支情况等因素后,Liu和Shen对美国巴 尔的摩市居住地建成环境与机动车行驶里程之间的关系进行了研究,结果表明居住密度对机 动车出行有显著的总影响。Hong和Shen2,Hong和 Goodchild分别研究了居住密度对 机动车出行的影响,研究结果均表明在控制了家庭收入及小汽车拥有等因素后,居住密度与 机动车出行成负相关。Ding等人的研究证实,工作地的职住关系对于通勤人员机动车出行 距离的影响比居住地的影响更为显著;在土地性质混和使用方面: Acker和wtox分析 了居住地和工作地的建成环境对居民出行方式选择的影响,研究表明随着居住地土地使用混 合度的提高,选择机动车出行的人数显著降低。 Antipova等人分析了美国巴吞鲁日的居住 地的职住平衡对居民机动车出行的影响,研究结果表明较高的职住平衡能够显著降低居民机 动车行驶里程,他们认为较高的职住平衡意味着短距离就业的可能性较大。由此,建成环 境与机动车出行密切相关 近几年随着空间计量模型的发展,在研究交通需求预测时,也将土地利用密度及混合使 用因素进行考量,其中OLS模型是一种较为广泛应用于分析多种因素混杂作用关系的方法 在OLS模型中,假定了各交通小区的数据是相互独立没有空间联系、且在各个小区之间的数 值是固定的。然而,机动化出行需求并不满足独立假定,由于小区与小区之间的差异性,各 交通小区间都存在较大的相互作用。因此,将OLS模型用于此研究的做法由于忽视了空间差 异而有很大弊端。 学者对传统OLS模型进行了改进,纳入了对空间差异性的考虑。其中GW模型应用最为 广泛,GWR通过构建基于距离的权重模型,以分析影响因素与出行需求之间的贡献程度关 系。GWR可以很好地刻画影响因素在空间维度上的作用,因此被广泛应用于交通研究中 但在使用GwR方法进行分析时,时间维度是GWR方法无法处理的范畴。然而时间维度 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
model.That is, the GTWR model is better than the traditional model in describing traffic demand forecasting. key words: Traffic Demand Estimation, OLSModel, GWR Model, GTWR Model, Spatial and Temporal Non-Stationarity 一、引言 近年来,随着机动车保有量不断增加,城市交通需求日益增长,仅挖掘现有道路的通行 能力远远不够,应结合交通规划的方法由供给端向需求端改进,对未来道路的交通需求进行 合理的预测从而为道路网规划建设提供较好的支撑,因此作为交通规划理论核心的交通需求 预测,其预测模型的准确度直接影响交通需求预测结果,选择能够较好的指导城市交通规划 实践的交通需求预测模型至关重要。 在过去的几年里已经吸引较多的学者研究交通需求预测模型,例如:四阶段法、时间序 列法等。以往的方法较少考虑建成环境对于交通需求的影响,但众所周知,交通小区土地利 用密度及混合使用对其交通需求量具有较大影响,以往有关的研究均说明该种现象:首先在 土地利用密度方面:在考虑了家庭小汽车拥有量及收支情况等因素后,Liu和Shen对美国巴 尔的摩市居住地建成环境与机动车行驶里程之间的关系进行了研究,结果表明居住密度对机 动车出行有显著的总影响[1] 。Hong 和Shen[2] ,Hong 和 Goodchild[3]分别研究了居住密度对 机动车出行的影响,研究结果均表明在控制了家庭收入及小汽车拥有等因素后,居住密度与 机动车出行成负相关。Ding 等人的研究证实,工作地的职住关系对于通勤人员机动车出行 距离的影响比居住地的影响更为显著[4];在土地性质混和使用方面:Acker 和 Witlox 分析 了居住地和工作地的建成环境对居民出行方式选择的影响,研究表明随着居住地土地使用混 合度的提高,选择机动车出行的人数显著降低[5]。Antipova 等人分析了美国巴吞鲁日的居住 地的职住平衡对居民机动车出行的影响,研究结果表明较高的职住平衡能够显著降低居民机 动车行驶里程,他们认为较高的职住平衡意味着短距离就业的可能性较大[6]。由此,建成环 境与机动车出行密切相关。 近几年随着空间计量模型的发展,在研究交通需求预测时,也将土地利用密度及混合使 用因素进行考量,其中OLS模型是一种较为广泛应用于分析多种因素混杂作用关系的方法。 在OLS模型中,假定了各交通小区的数据是相互独立没有空间联系、且在各个小区之间的数 值是固定的。然而,机动化出行需求并不满足独立假定,由于小区与小区之间的差异性,各 交通小区间都存在较大的相互作用。因此,将OLS模型用于此研究的做法由于忽视了空间差 异而有很大弊端。 学者对传统OLS模型进行了改进,纳入了对空间差异性的考虑。其中GWR模型应用最为 广泛,GWR通过构建基于距离的权重模型,以分析影响因素与出行需求之间的贡献程度关 系。GWR可以很好地刻画影响因素在空间维度上的作用,因此被广泛应用于交通研究中。 但在使用GWR方法进行分析时,时间维度是GWR方法无法处理的范畴。然而时间维度
在交通分析中尤为重要,例如,早晚高峰的出行需求往往比平峰多出50%,这说明出行需求 是具有时间差异性的。出行需求的时间差异特性代表了它对历史数据具有敏感性。因此,出 行需求数据的时空特性分析在交通领域中一直是炙手可热的研究方向。 尽管已有不少研究分析过出行需求的时空特性,这些研究大多着力于对个体出行者的出 行行为研究,少有研究基于交通小区对出行需求的时空特性进行分析。同时,多数在交通小 区基础上分析各种因素对出行需求影响的研究,仅基于GWR模型研究了空间差异性对出行 需求的影响,而少有将时间差异性与空间差异性结合的研究。为了弥补这一缺憾,本文采用 GTwR模型对机动化出行需求进行研究和分析。 本文余下部分研究结构如下所示:方法部分对于GTWR模型进行具体介绍:案例部分描 述了运用杭州市车牌识别数据进行交通需求预测的过程:结果对比与分析部分介绍了三种预 测模型的具体应用过程,并将三种模型预测精度进行对比 二、方法 黄波在GWR方法的基础上提出了考虑时空因素的GTWR模型,其用于对与时空特性相 关的房价问题的建模;随后,GTWR模型被大量运用于有关时空问题的研究中。韩兆洲等 人基于2006-2014年省级时空数据,分别运用时间加权回归模型(TWR)、GWR模型及GTWR 模型分析我国各个地区的最低工资增长率的非平稳性;丁焕峰等人运用GTWR模型探索了 城乡区域间收入水平的时空差异性;马晓磊等人首次将GTWR模型运用于交通领域,分析 建成环境对于公交客流的影响田。 本文应用GIWR模型,根据杭州市各个交通小区的空间位置,各种类型的PO密度以及 居民出行信息进行交通需求预测,模型的具体步骤如下所示: ①获取数据 获取杭州市各个交通小区的地理坐标(u),Y表示i小区的交通需求,t表示采样时间 (本文取1个小时),表示各个交通小区各种类型的PO1密度矩阵。 ②计算每个交通小区与其他交通小区的时空距离 由于时间通常以小时或天为测量单位,空间通常为m或km为测量单位,二者测量标 准的差异会对结果造成较大偏差,因此需要设置参数平衡时空差异,交通小区i和j之间的 时空距离公式如下所示: (d)2=1(n1-1)2+("-")]+(1-1)2 μ和λ为平衡时空差异的参数,μ和λ值的设定对于研究结果具有较大影响 ③构建交通小区之间的时空相关性矩阵W H= diag(W1…,Wn)为对角矩阵,对角元素为两个交通小区之间相互影响的权重值, (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
在交通分析中尤为重要,例如,早晚高峰的出行需求往往比平峰多出50%,这说明出行需求 是具有时间差异性的。出行需求的时间差异特性代表了它对历史数据具有敏感性。因此,出 行需求数据的时空特性分析在交通领域中一直是炙手可热的研究方向。 尽管已有不少研究分析过出行需求的时空特性,这些研究大多着力于对个体出行者的出 行行为研究,少有研究基于交通小区对出行需求的时空特性进行分析。同时,多数在交通小 区基础上分析各种因素对出行需求影响的研究,仅基于GWR模型研究了空间差异性对出行 需求的影响,而少有将时间差异性与空间差异性结合的研究。为了弥补这一缺憾,本文采用 GTWR模型对机动化出行需求进行研究和分析。 本文余下部分研究结构如下所示:方法部分对于GTWR模型进行具体介绍;案例部分描 述了运用杭州市车牌识别数据进行交通需求预测的过程;结果对比与分析部分介绍了三种预 测模型的具体应用过程,并将三种模型预测精度进行对比。 二、方法 黄波在GWR方法的基础上提出了考虑时空因素的GTWR模型,其用于对与时空特性相 关的房价问题的建模[7];随后,GTWR模型被大量运用于有关时空问题的研究中。韩兆洲等 人基于2006—2014年省级时空数据,分别运用时间加权回归模型(TWR)、GWR模型及GTWR 模型分析我国各个地区的最低工资增长率的非平稳性[8];丁焕峰等人运用GTWR模型探索了 城乡区域间收入水平的时空差异性[9];马晓磊等人首次将GTWR模型运用于交通领域,分析 建成环境对于公交客流的影响[11]。 本文应用GTWR模型,根据杭州市各个交通小区的空间位置,各种类型的POI密度以及 居民出行信息进行交通需求预测,模型的具体步骤如下所示: ①获取数据 获取杭州市各个交通小区的地理坐标(u,v),Yi 表示 i 小区的交通需求,t 表示采样时间 (本文取 1 个小时),Xik表示各个交通小区各种类型的 POI 密度矩阵。 ②计算每个交通小区与其他交通小区的时空距离 由于时间通常以小时或天为测量单位,空间通常为 m 或 km 为测量单位,二者测量标 准的差异会对结果造成较大偏差,因此需要设置参数平衡时空差异,交通小区 i 和 j 之间的 时空距离公式如下所示: 2 2 2 2 ( ) [( ) ( ) ] ( ) i j i j i j ST d u u v v t t (1) μ 和 λ 为平衡时空差异的参数,μ 和 λ 值的设定对于研究结果具有较大影响。 ③构建交通小区之间的时空相关性矩阵 W ( ,...., ) W diag W1 Wn 为对角矩阵,对角元素为两个交通小区之间相互影响的权重值
般来说,与交通小区i距离越近的交通小区,对该小区交通需求的影响越大,时空距离矩 阵一般运用高斯函数构建: (d)2 W=exp(-=12) ④对带宽h,时空参数μ和进行标定 为了简化上述模型,令τ=uA,则距离公式可以表示为 (d)2 之=4-4)+(-1)]+(-1)2 (3) 利用交叉验证计算残差平方和,绘制以h为横坐标,以残差平方和为纵坐标来确定参数 h的最优值。 CRSS(h)=∑(y-y2(h) ⑤回归参数估计 GTWR模型基本形式如下所示 Y=B(u1,",)+∑B(u1,,)X从+E 其中,G为误差项,(xy2b为不同类型PO对于交通小区交通需求的时空相关程度, 使用最小二乘估计方法,通过使残差平方和最小来估计相关系数 因此,各种类型POI密度与交通需求之间的参数估计可以表示为: B(u v, =[Xw(u v,oXrY'w(u, v, L, )Y 三、案例分析 在本部分,杭州市是我们选择验证GTWR模型是否适用于交通需求预测研究的城市, 我们应用杭州市车牌数据及杭州市路网进行探究,将杭州市划分为126个交通小区,并且建 立杭州市交通需求影响因素的数据集 )车牌数据 车牌数据相对于其他数据来说具有样本量大和精确度高的特点,车牌数据包括车辆的 车牌号、运行时间、地点以及车辆类别等,因此我们能从数据中获取所有车辆的出行链。杭 州市共有1399个检测器,且检测器覆盖率在90%以上,因此据此获取的车牌数据能够较完 整的描述杭州市机动化出行,表1显示了检测设备的记录表,检测设备的详细经纬度坐标便 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
一般来说,与交通小区 i 距离越近的交通小区,对该小区交通需求的影响越大,时空距离矩 阵一般运用高斯函数构建: exp( ) 2 2 h d W ST ij ( ) (2) ④对带宽 h,时空参数 μ 和 λ 进行标定 为了简化上述模型,令 τ=μ/λ,则距离公式可以表示为 2 2 2 2 [( ) ( ) ] ( ) ( ) i j i j i j ST u u v v t t d (3) 利用交叉验证计算残差平方和,绘制以 h 为横坐标,以残差平方和为纵坐标来确定参数 h 的最优值。 2 1 CVRSS(h) ( y y (h)) i i (4) ⑤回归参数估计 GTWR 模型基本形式如下所示: i i i ik i k Yi (ui ,vi ,ti) k (u ,v ,t )X 0 (5) 其中,εi 为误差项,βk(xi,yi,ti)为不同类型 POI 对于交通小区交通需求的时空相关程度, 使用最小二乘估计方法,通过使残差平方和最小来估计相关系数。 因此,各种类型 POI 密度与交通需求之间的参数估计可以表示为: u v t X W u v t X X W ui vi ti Y T i i i T i i i ( , , ) [ ( , , ) ] ( , , ) 1 (6) 三、案例分析 在本部分,杭州市是我们选择验证 GTWR 模型是否适用于交通需求预测研究的城市, 我们应用杭州市车牌数据及杭州市路网进行探究,将杭州市划分为 126 个交通小区,并且建 立杭州市交通需求影响因素的数据集。 (一)车牌数据 车牌数据相对于其他数据来说具有样本量大和精确度高的特点[12],车牌数据包括车辆的 车牌号、运行时间、地点以及车辆类别等,因此我们能从数据中获取所有车辆的出行链。杭 州市共有 1399 个检测器,且检测器覆盖率在 90%以上,因此据此获取的车牌数据能够较完 整的描述杭州市机动化出行,表 1 显示了检测设备的记录表,检测设备的详细经纬度坐标便
于区分车辆所在的地点。表2展示了车牌数据的相关信息表 表1设备点位记录表 设备表主要信息 数据形式 数据说明 DEV ID 50091 备点位编码 DEV NAME 玉古路求是路北口 设备点位名称 120.127709,30.26547 备点位经纬度坐标 表2过车记录表 车牌识别主要信息 数据形式 数据说明 过车记录编号 DEV_ID 2147726 采集设备点位编号 DEV NAME 中河高架西湖大道东下匝 采集设备点位名称 WAY ID 车辆匹配时所处的车道 车牌识别数据,存在未识别和无牌 CAR TYPE 车辆类型,不同数字代表不同类型 CAP DATE 2016/6/130:09:1 采集时间,精确到秒 (二)建成环境 随着计算机技术、数据传输等技术的不断发展,各种交通数据传感器应运而生,使得研 究者能够大范围、自动化地获取机动车出行路径,而且越来越多的网络地图数据也能为研究 所应用,比如:百度地图AP12,谷歌地图AP1,高德地图开放平台等,本文利用高德 地图开放平台并根据高德地图自定义编码表爬取所需类型的POI数据,见表3:每种类型的 POI记录都包含该种类型PO1的名称以及经纬度坐标,运用 AEGIS软件得到每个交通小区 各种类型POI的密度,第k种类型POI密度的计算公式如下所示 Vk第k种类型的PO1数量/交通小区i的面积 (7) 据此,交通小区i的POl向量被表示为x=(v,2…,vF,此处F表示为POl类别的数量。 表3P0|类别 Po|种类 Po|种类 院 银行和金融机构 旅店 14 生活服务 停车场 789 对外交通 政府机构 公交地铁站 便利店 咖啡厅 (三)交通需求预测 我们利用杭州市车牌数据计算交通需求,根据车牌数据中的车牌号以及检测时间,可以 得到每辆机动车的一系列出行点,因此每辆车的出行链被获取,通过识别出行链中每个相邻 点之间时空关系,我们能够识别出行链中的间断点,根据检测器编号的地理信息,将其聚类 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
于区分车辆所在的地点。表 2 展示了车牌数据的相关信息表。 表 1 设备点位记录表 设备表主要信息 数据形式 数据说明 DEV_ID 2150091 设备点位编码 DEV_NAME 玉古路求是路北口 设备点位名称 XY 120.127709,30.265471 设备点位经纬度坐标 表 2 过车记录表 车牌识别主要信息 数据形式 数据说明 ID 8071219675 过车记录编号 DEV_ID 2147726 采集设备点位编号 DEV_NAME 中河高架西湖大道东下匝道 采集设备点位名称 WAY_ID 1 车辆匹配时所处的车道 CAR_NUM 浙 AT5738 车牌识别数据,存在未识别和无牌 CAR_TYPE 1 车辆类型,不同数字代表不同类型 CAP_DATE 2016/6/13 0:09:15 采集时间,精确到秒 (二)建成环境 随着计算机技术、数据传输等技术的不断发展,各种交通数据传感器应运而生,使得研 究者能够大范围、自动化地获取机动车出行路径,而且越来越多的网络地图数据也能为研究 所应用,比如:百度地图 API[12],谷歌地图 API[13],高德地图开放平台[14]等,本文利用高德 地图开放平台并根据高德地图自定义编码表爬取所需类型的 POI 数据,见表 3:每种类型的 POI 记录都包含该种类型 POI 的名称以及经纬度坐标,运用 ACGIS 软件得到每个交通小区 各种类型 POI 的密度,第 k 种类型 POI 密度的计算公式如下所示: Vk=第 k 种类型的 POI 数量/交通小区 i 的面积 (7) 据此,交通小区 i 的 POI 向量被表示为 xi=(v1,v2,...,vF),此处 F 表示为 POI 类别的数量。 表 3 POI 类别 编号 POI 种类 编号 POI 种类 1 医院 11 购物中心 2 学校 12 饭店 3 银行和金融机构 13 景区 4 旅店 14 运动 5 住宅 15 影剧院 6 生活服务 16 停车场 7 对外交通 17 政府机构 8 公交地铁站 18 便利店 9 公司 19 咖啡厅 10 娱乐设施 (三)交通需求预测 我们利用杭州市车牌数据计算交通需求,根据车牌数据中的车牌号以及检测时间,可以 得到每辆机动车的一系列出行点,因此每辆车的出行链被获取,通过识别出行链中每个相邻 点之间时空关系,我们能够识别出行链中的间断点,根据检测器编号的地理信息,将其聚类