地铁客流量灰色关联度及预测模型研究 叶然然赵姣 长安大学汽车学院,陕西西安710064) 摘要:在仅有通车5年的地铁客流量小样本数据条件下,为了合理、科学地预测各城市 地铁客流量,量化不同影响因素对客流量的影响程度,本文提出了基于 Matlab的 灰色系统地铁客流量预测模型;以实际调硏的三个城市8条地铁线路的统计数据为 样本,运用灰色关联度模型对不同影响因素的影响程度进行量化评估;分别建立GM (1,1)单变量预测模型与GM(1,N)多变量预测模型对客流量进行预测分析。研 究结果表明:本文选取的影响因素对客流量的灰色关联度均大于0.5,说明它们对 客流量均具有较大影响;GM(1,1)预测模型85%的预测结果误差在10%以内,GM (1,N)预测模型80%的预测结果误差大于40%,从而得出GM(1,1)预测模型比 GM(1,N)预测模型的预测结果更加淮准确。因此,针对通车5年的地铁客流量小样 本数据预测,选用单变量预测模型更加科学、合理。 关镳词:交通运输工程;地铁客流量预测;灰色关联度;灰色预测模型 Research on grey relational grade and prediction model of subway passenger YE Ran-ran ZHAO Jigo ( School of automobile, Chang'an University, Shanxi Xi'an 710064) Abstract: Under the condition of small sample data of metro passenger flow quantity with only 5 years of operation, in order to predict metro passenger flow quantity reasonably and scientifically in each city, the research quantified the influence degree of different influencing factors on passenger flow quantity. This paper proposes a prediction model of the grey system of subway passenger flow quantity based on MATLAB. Based on the statistical data of 8 metro lines in three cities, this paper quantitatively evaluates the influence degree of different influencing factors by using grey correlation grade model, and establishes the GM(l, I) single variable prediction model and the GM(l, N)multi-variable prediction model to predict the passenger flow quantity. The results show that the grey correlation degree of the influencing factors selected in this paper is greater than 0.5, which indicates that they have great influence on the passenger flow quantity The prediction error of the GM(1, 1)prediction model of 85% is less than 10%, and that of the GM(I, N prediction model of 80% is more than 40%, which indicates that the Gm(l, I) prediction model is more accurate than the GM(1, N)prediction model. Therefore, the single variable prediction model is more reasonable and scientific for the small sample data prediction of subway passenger flow quantity for 5 years (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
地铁客流量灰色关联度及预测模型研究 叶然然赵姣 (长安大学 汽车学院,陕西 西安 710064) 摘要: 在仅有通车 5 年的地铁客流量小样本数据条件下,为了合理、科学地预测各城市 地铁客流量,量化不同影响因素对客流量的影响程度,本文提出了基于 Matlab 的 灰色系统地铁客流量预测模型;以实际调研的三个城市 8 条地铁线路的统计数据为 样本,运用灰色关联度模型对不同影响因素的影响程度进行量化评估;分别建立 GM (1,1)单变量预测模型与 GM(1,N)多变量预测模型对客流量进行预测分析。研 究结果表明:本文选取的影响因素对客流量的灰色关联度均大于 0.5,说明它们对 客流量均具有较大影响;GM(1,1)预测模型 85%的预测结果误差在 10%以内,GM (1,N)预测模型 80%的预测结果误差大于 40%,从而得出 GM(1,1)预测模型比 GM(1,N)预测模型的预测结果更加准确。因此,针对通车 5 年的地铁客流量小样 本数据预测,选用单变量预测模型更加科学、合理。 关键词:交通运输工程;地铁客流量预测;灰色关联度;灰色预测模型 Research on grey relational grade and prediction model of subway passenger flow quantity YE Ran-ran ZHAO Jiao (School of automobile,Chang’an University,Shanxi Xi’an 710064) Abstract: Under the condition of small sample data of metro passenger flow quantity with only 5 years of operation, in order to predict metro passenger flow quantity reasonably and scientifically in each city, the research quantified the influence degree of different influencing factors on passenger flow quantity.This paper proposes a prediction model of the grey system of subway passenger flow quantity based on MATLAB. Based on the statistical data of 8 metro lines in three cities, this paper quantitatively evaluates the influence degree of different influencing factors by using grey correlation grade model, and establishes the GM (1,1) single variable prediction model and the GM (1,N) multi-variable prediction model to predict the passenger flow quantity. The results show that the grey correlation degree of the influencing factors selected in this paper is greater than 0.5, which indicates that they have great influence on the passenger flow quantity. The prediction error of the GM (1,1) prediction model of 85% is less than 10%, and that of the GM (1,N) prediction model of 80% is more than 40%,which indicates that the GM (1,1) prediction model is more accurate than the GM (1, N) prediction model. Therefore, the single variable prediction model is more reasonable and scientific for the small sample data prediction of subway passenger flow quantity for 5 years
Key words: Transportation engineering; subway passenger flow quantity forecasting; grey correlation degree; grey prediction model 引言 近年来,随着国家经济的迅速发展,交通网络的规模越来越大,城市轨道交通也随之快 速发展起来。随着城市轨道交通网络的日益完善及客流量的不断增加,地铁站客流过度饱和 情况经常岀现,尤其是工作日的早晩高峰时段、大型活动和突发事件等情况下[]l因此, 准确的预测地铁客流量有利于地铁的运营管理和车辆调度,建立科学合理的地铁预测模型显 得尤为迫切 近几年众多学者对地铁、公交、铁路等客流量预测的模型进行硏究,大多数都是对短时 客流量进行预测,因为长期的客流量预测比较难,不同时期,不同的经济发展阶段客流量都 会有变化,在短时客流量的预测研究中,所选择的模型主要有两类:一类是基于数学和数理 统计的理论模型,一类是基于计算机的仿真技术模型。研究客流量预测的相关的文献主要集 中于:①姚恩建等提出了基于改进K近邻非参数回归的新站开通初期实时进出站客流量预 测方法[2]。②王炜炜选用BP人工神经网络、灰色模型、重力模型建立了高速铁路影响下的 铁路客流量预测模型对铁路客流量进行预测[3]。③李捷基于深度学习的方法对地铁短时客 流量进行预测硏究[4]④徐逸之等提出了基于栈式自编码的上海地铁短时流量预测模型[5] ⑤王洁提出了粒计算的公交客流量分析方法,并提高了预测公交客流量的精度[6]。但是 大部分对地铁客流量的硏究中,对于影响客流量的因素较多停留在定性分析层面,进行量化 分析的较少。目前,在铁路客车运用效率评价、列车运行图质量评价中较多引用灰色关联度 模型[7、8,而在地铁客流量影响因素分析中采用较少。另外,针对5年小样本数据进行预 测,也没有一个较为明确的预测模型。本文采用灰色关联度模型对地铁客流量的影响因素进 行量化评估,给出各影响因素对地铁客流量的影响程度;对于小样本数据(5个数据)分别 建立GM(1,1)单变量预测模型与GM(1,N)多变量预测模型进行预测,提出适合于小 样本数据的地铁客流量预测方法,并分析了适用性。 二、地铁客流量与自变量灰色关联度分析 (一)地铁客流量影响因素分析 国内大部分城市都修建了较多地铁,由于地铁速度快,运输能力强,日渐为人们喜爱的 种交通出行方式,而影响地铁客流量的因素与很多,比如区域经济发展水平、城镇居民生 活水平、人口数量变化、旅游供给能力等因素9-10 (1)区域经济发展水平 城市的经济发展水平很大程度的影响城市的客流量,经济水平越高的城市就会吸引周围 地区的人们大量涌入,其客流量的数据也会越大。生产总值(GDP),第一、第二、第三生 产总值等都反映了经济发展的情况及水平[1交通运输业作为基本建设近几年来也随着经 济水平的提高在迅猛发展。生产总值记为W1,其单位为亿元。 (2)城镇居民生活水平 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
Key words:Transportation engineering; subway passenger flow quantity forecasting; grey correlation degree; grey prediction model 一、引言 近年来,随着国家经济的迅速发展,交通网络的规模越来越大,城市轨道交通也随之快 速发展起来。随着城市轨道交通网络的日益完善及客流量的不断增加,地铁站客流过度饱和 情况经常出现,尤其是工作日的早晚高峰时段、大型活动和突发事件等情况下[1]。因此, 准确的预测地铁客流量有利于地铁的运营管理和车辆调度,建立科学合理的地铁预测模型显 得尤为迫切。 近几年众多学者对地铁、公交、铁路等客流量预测的模型进行研究,大多数都是对短时 客流量进行预测,因为长期的客流量预测比较难,不同时期,不同的经济发展阶段客流量都 会有变化,在短时客流量的预测研究中,所选择的模型主要有两类:一类是基于数学和数理 统计的理论模型,一类是基于计算机的仿真技术模型。研究客流量预测的相关的文献主要集 中于:①姚恩建等提出了基于改进 K 近邻非参数回归的新站开通初期实时进出站客流量预 测方法[2]。②王炜炜选用 BP 人工神经网络、灰色模型、重力模型建立了高速铁路影响下的 铁路客流量预测模型对铁路客流量进行预测[3]。③李捷基于深度学习的方法对地铁短时客 流量进行预测研究[4]。④徐逸之等提出了基于栈式自编码的上海地铁短时流量预测模型[5]。 ⑤王洁提出了粒计算的公交客流量分析方法,并提高了预测公交客流量的精度[6]。但是, 大部分对地铁客流量的研究中,对于影响客流量的因素较多停留在定性分析层面,进行量化 分析的较少。目前,在铁路客车运用效率评价、列车运行图质量评价中较多引用灰色关联度 模型[7、8],而在地铁客流量影响因素分析中采用较少。另外,针对 5 年小样本数据进行预 测,也没有一个较为明确的预测模型。本文采用灰色关联度模型对地铁客流量的影响因素进 行量化评估,给出各影响因素对地铁客流量的影响程度;对于小样本数据(5 个数据)分别 建立 GM(1,1)单变量预测模型与 GM(1,N)多变量预测模型进行预测,提出适合于小 样本数据的地铁客流量预测方法,并分析了适用性。 二、地铁客流量与自变量灰色关联度分析 (一)地铁客流量影响因素分析 国内大部分城市都修建了较多地铁,由于地铁速度快,运输能力强,日渐为人们喜爱的 一种交通出行方式,而影响地铁客流量的因素与很多,比如区域经济发展水平、城镇居民生 活水平、人口数量变化、旅游供给能力等因素[9-10]。 (1)区域经济发展水平 城市的经济发展水平很大程度的影响城市的客流量,经济水平越高的城市就会吸引周围 地区的人们大量涌入,其客流量的数据也会越大。生产总值(GDP),第一、第二、第三生 产总值等都反映了经济发展的情况及水平[11]。交通运输业作为基本建设近几年来也随着经 济水平的提高在迅猛发展。生产总值记为 W1,其单位为亿元。 (2)城镇居民生活水平
经济的快速发展也使得人们的生活水平逐渐提高,居民的收入也越来越充足,人均出行 次数增多,地铁的客流量也相应的增加。由此可见居民的生活水平越高,对地铁等交通运输 设施的需求也越大。能够反映人民的生活水平及结构的指标有居民人均可支配收入、消费价 格指数水平、交通和通信费用支出[12]。城镇居民人均可支配收入记为W2,其单位为元 (3)人口数量发展状况 城市人口的数量对地铁客流量数据的变化有着直接的影响,随着市区和流动人口的逐渐 增多,客运量的需求也在迅速增加。人口越密集的地区,人们出行的频率也就较高。城市人 口数量随着城市经济水平的提高每年都在逐渐增多,人们在城市之间往返的出行次数也在逐 渐增加,因此地铁的客流量数据也逐年增加。城镇人口总数记为W3,其单位为万人。 (4)第三产业的发展 第三产业即各类服务或商品,随着人们生活水平的提高,在满足基本的生活需求后,逐 渐注重生活质量的提高,因此,这就促进了第三产业的发展,其中旅游成为人们所热衷的 种提高自己的生活质量和开拓自己的眼界的方式。如“春节”、“中秋佳节”、“国庆节” 等黄金假期时间,人们更愿意到各大城市去旅游。因此在旅游高峰期,城市地铁的客流量大 大增加。第三产业主要以旅游业为主,其影响指标可以通过第三产业生产总值体现。第三产 业生产总值为W4,单位万人。 (二)建立自变量与因变量的灰色关联分析模型 考虑到影响地铁客流量的某些影响因素很难量化及所收集到信息的局限性,本文从区域 经济发展水平、人们生活水平、人口数量变化、旅游供给能力四个方面选取了4个指标,分 别以西安、长春、成都三个城市的生产总值、居民人均可支配收入、城镇总人口数量、第三 产业总值为指标,建立自变量与因变量的灰色关联度分析模型 (1)初始数据处理 针对确定的四个影响因素,各城市的生产总值、居民人均可支配收入、城镇总人口数量、 第三产业总值进行初步处理,由于四个影响因素量纲不同、意义不同,且在数量上悬殊很大, 因此在进行建模前要先采用初值化算子将各序列样本值化为无量纲数据 设X1=(x(1),X(2),…,X(n))为因素x,的行为序列,D1为序列算子,且 xD=(x()d,x(2)d1…,X,(n)d),其中 x(k)d=x(k)/x():k=,2…,n(1) Dl为处值化算子,为原像,XD为X,在初值化算子D1的像,即初值像[13] (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
经济的快速发展也使得人们的生活水平逐渐提高,居民的收入也越来越充足,人均出行 次数增多,地铁的客流量也相应的增加。由此可见居民的生活水平越高,对地铁等交通运输 设施的需求也越大。能够反映人民的生活水平及结构的指标有居民人均可支配收入、消费价 格指数水平、交通和通信费用支出[12]。城镇居民人均可支配收入记为 W2,其单位为元。 (3)人口数量发展状况 城市人口的数量对地铁客流量数据的变化有着直接的影响,随着市区和流动人口的逐渐 增多,客运量的需求也在迅速增加。人口越密集的地区,人们出行的频率也就较高。城市人 口数量随着城市经济水平的提高每年都在逐渐增多,人们在城市之间往返的出行次数也在逐 渐增加,因此地铁的客流量数据也逐年增加。城镇人口总数记为 W3,其单位为万人。 (4)第三产业的发展 第三产业即各类服务或商品,随着人们生活水平的提高,在满足基本的生活需求后,逐 渐注重生活质量的提高,因此,这就促进了第三产业的发展,其中旅游成为人们所热衷的一 种提高自己的生活质量和开拓自己的眼界的方式。如“春节”、“中秋佳节”、“国庆节” 等黄金假期时间,人们更愿意到各大城市去旅游。因此在旅游高峰期,城市地铁的客流量大 大增加。第三产业主要以旅游业为主,其影响指标可以通过第三产业生产总值体现。第三产 业生产总值为 W4,单位万人。 (二)建立自变量与因变量的灰色关联分析模型 考虑到影响地铁客流量的某些影响因素很难量化及所收集到信息的局限性,本文从区域 经济发展水平、人们生活水平、人口数量变化、旅游供给能力四个方面选取了 4 个指标,分 别以西安、长春、成都三个城市的生产总值、居民人均可支配收入、城镇总人口数量、第三 产业总值为指标,建立自变量与因变量的灰色关联度分析模型。 (1)初始数据处理 针对确定的四个影响因素,各城市的生产总值、居民人均可支配收入、城镇总人口数量、 第三产业总值进行初步处理,由于四个影响因素量纲不同、意义不同,且在数量上悬殊很大, 因此在进行建模前要先采用初值化算子将各序列样本值化为无量纲数据。 设 ( (1), (2),..., (n)) ii i i XX X X 为因素 i X 的行为序列,D1 为序列算子,且 Xiii i D X d X d X nd 1 11 1 1 , ,..., 2 ,其中: 1 1 12 ; , ,..., i ii x kd x k x k n (1) D1 为处值化算子, i X 为原像, i 1 X D 为 i X 在初值化算子 D1 的像,即初值像[13]
经过上述方法进行处理后。得到表1 表1训研各城市消除量纲后样本数据 序号各城市地铁 年份 地铁客流量 12 w3 14 1.000 1.000 1.000 1.0001.000 西安地铁二 1.481 l.199 1.190 1.091 1.5031.344 号线 1.737 1.131 1.533 2.164 长春地铁三 1.198 1.0351.200 号线 1.280 1.320 2017 1.274 0.995 1.000 1.0001.000 l.120 成都地铁一 1.856 1.186 1.0341.247 号线 2017 3.000 1.525 1.299 1.208 (2)自变量与因变量灰色关联度分析 在建立预测模型之前,需要分析各自变量与因变量之间的相关性,即定量分析各城市的 生产总值、居民人均可支配收入、城镇总人口数量、第三产业总值对各城市地铁客流量的影 响程度 采用灰色关联度模型进行自变量与因变量相关性分析 设系统行为序列 X。=(X(1),X(2 ro(n)) X1=(X(1),X X=(X(1),x(2 xn=(X(1),X(2) 对于5∈(0,1),令 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
经过上述方法进行处理后。得到表 1: 表 1 调研各城市消除量纲后样本数据 序号 各城市地铁 年份 地铁客流量 W1 W2 W3 W4 1 西安地铁二 号线 2013 1.000 1.000 1.000 1.000 1.000 2014 1.264 1.121 1.003 1.481 1.199 2015 1.402 1.190 1.091 1.503 1.344 2016 1.737 1.281 1.131 1.533 1.502 2017 2.164 1.529 1.164 1.979 1.802 2 长春地铁三 号线 2013 1.000 1.000 1.000 1.000 1.000 2014 1.118 1.068 1.049 1.002 1.092 2015 1.208 1.105 1.198 1.035 1.200 2016 1.280 1.171 1.193 1.001 1.320 2017 1.362 1.305 1.274 0.995 1.510 3 成都地铁一 号线 2013 1.000 1.000 1.000 1.000 1.000 2014 1.399 1.104 1.090 1.019 1.120 2015 1.856 1.186 1.117 1.034 1.247 2016 2.274 1.336 1.198 1.178 1.413 2017 3.000 1.525 1.299 1.208 1.525 (2)自变量与因变量灰色关联度分析 在建立预测模型之前,需要分析各自变量与因变量之间的相关性,即定量分析各城市的 生产总值、居民人均可支配收入、城镇总人口数量、第三产业总值对各城市地铁客流量的影 响程度。 采用灰色关联度模型进行自变量与因变量相关性分析。 设系统行为序列: XX X X 00 0 0 (1), (2),..., (n) XX X X 11 1 1 (1), (2),..., (n) XX X X ii i i (1), (2),..., (n) XX X X nn n n (1), (2),..., (n) 对于 ( ,) 0 1 ,令
r(o(k), x,(K) 1()-x(6别+哪x()-x((2) ()-x()+5mXmx(k)-x(k) y(xn,x)=1∑(x(),x(6)(3) 则(X,x)称为x0与X的灰色关联度 通过灰色关联度计算公式进行计算,得到各自变量与因变量的关联度,将计算结果汇总 如表2 表2自变量与地铁客流量关联度 序号 各城市地铁 自变量 关联度 w2 0.612 西安地铁二号线 0.794 0.808 0.763 长春地铁三号线 w3 0.572 w4 0.842 0.638 0.618 成都地铁一号线 0.60 0.649 由表2结果可知,从单因素分析各自变量与因变量的关联度均大于0.5,表明各自变量 与因变量的变化趋势大体接近,四个自变量对因变量均有较大影响,选取的四个自变量具有 定的合理性:另外,关联度越大,表示自变量对因变量影响程度越大。但是,四个因素综 合起来对地铁客流量的影响程度无法进行判断 三、地铁客流量灰色系统预测模型 通过上述分析,地铁客流量预测模型中共有四个自变量,从理论上预测模型应选用多变 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
0 0 0 0 0 min min max max , max max i i ik ik i i i i k x k xk xk xk xk xk xk xk xk xk (2) 0 0 1 1 , , n i i k X X xk xk n (3) 则 0 , i X X 称为 0 X 与 i X 的灰色关联度[13]。 通过灰色关联度计算公式进行计算,得到各自变量与因变量的关联度,将计算结果汇总 如表 2: 表 2 自变量与地铁客流量关联度 序号 各城市地铁 自变量 关联度 1 西安地铁二号线 W1 0.689 W2 0.612 W3 0.794 W4 0.808 2 长春地铁三号线 W1 0.763 W2 0.806 W3 0.572 W4 0.842 3 成都地铁一号线 W1 0.638 W2 0.618 W3 0.601 W4 0.649 由表 2 结果可知,从单因素分析各自变量与因变量的关联度均大于 0.5,表明各自变量 与因变量的变化趋势大体接近,四个自变量对因变量均有较大影响,选取的四个自变量具有 一定的合理性;另外,关联度越大,表示自变量对因变量影响程度越大。但是,四个因素综 合起来对地铁客流量的影响程度无法进行判断。 三、地铁客流量灰色系统预测模型 通过上述分析,地铁客流量预测模型中共有四个自变量,从理论上预测模型应选用多变