科技导报2017,35(14) www.kjdb.org 导报 空间交互网络研究进展 闫小勇 北京交通大学交通系统科学与工程研究院,北京100044 摘要空间交互网络是人、商品和信息等在地点之间流动而形成的嵌入在空间中的有向流网络。典型的空间交互网络包括国际 贸易网络、人口迁移网络、人群出行网络及电话通信网络等。理解和预测空间交互网络中的流量分布模式不仅是区域科学、交通 科学、经济地理学等很多领域长期以来的一个重要研究主题,在城市和交通规划、疾病传播防控、商业服务等领域也具有广泛应 用价值。本文在简要介绍引力模型、介入机会模型等经典空间交互模型的基础上,着重对近年来复杂系统研究领域在空间交互 网络建模方面的研究成果进行介绍,包括辐射模型、人口权重机会模型及空间交互网络上的随机游走模型等,并且对空间交互网 络研究中存在的挑战性问题进行探讨,包括个体多样性行为建模、群体空间交互决策行为实验、数据驱动的活动一出行行为 研究等。 关镜词空间交互;复杂网络;人类移动模式;出行分布预测 空间交互是指人、商品和信息等在地点之间的流动,这普遍存在着引力定律,即网络节点之间的交互强度近似 种流动自然形成了嵌入在地理空间中的有向流网络一一空正比于节点强度乘积与节点间距离幂函数的比值。而类比 间交互网络。空间交互网络在日常生活中无处不在:身处牛顿万有引力定律提出的空间交互引力模型吗,也自然地成 不同城市的人们通过电话、社交App等进行沟通联络,形成为解释和预测空间网络交互强度的经典模型,被广泛应用于 了以城市为节点电话或网络通信量为边权的通信网络:不包括交通规划、人口迁移叫国际贸易、通信网络"甚至 同国家之间进行商品贸易形成了以国家为节点贸易量或在线商品推荐等在内的诸多领域中。进入21世纪后,随着 物流量为边权的贸易网络叫。更直接的例子则是人类自身的手机全球定位系统(GFS)、移动互联网等现代信息通信技术 移动在长时间尺度上,人口在城市或国家之间流动,形成了的飞速发展大规模、高精度的人类空间交互数据的可获取 人口迁移网络;而在短时间尺度上,每天进行的出行活动形程度不断提高,一些数据驱动的空间交互新模型不断涌现 成了人群出行网络。显然,研究这些空间交互网络上的流极大地丰富和发展了空间交互网络研究的理论与方法。本 量模式形成机制、预测这些网络上的连边交互强度等都是具文将简要介绍经典的空间交互模型引力模型,并重点对近年 有重要价值的问题。这些问题的研究对于制订区域经济和来统计物理和复杂系统研究领域在空间交互网络建模方面 人口发展政策规划和管理交通、通信等基础设施网络、预防的一些研究成果进行介绍。 和控制流行病的传播、提供基于位置的商业服务等具有重要 的实际意义。 1空间交互引力模型 空间交互网络研究中一个基本问题是:在已知各地点的11引力模型及其扩展 人口(或经济产值、流出总量等反映地点体量差异的指标)和 引力模型是最早被提出的空间交互强度预测模型μ,其 地点之间距离(或移动成本、出行时间等反映地点之间阻隔基本假设是两地之间(人口、出行、贸易等)的交 程度的指标)等数据的前提下预测地点之间空间交互的强的人口数成正比,与两地间距离的幂数互量与两地 度(即流量)。解决这类问题的模型在区域科学和经济地理 T= 学中被称为空间交互模型,而在交通科学中则被称为出行 分布预测模型叫。早在100多年前,研究者们就发现在人群式中,T为从起点到终点的流量;m和m分别为起终点的人 出行网络、人口迁移网络、商品贸易网络等空间交互网络中口数;d为两者间的距离;a,B为2个可调参数,需要根据实际 收稿日期:2017-05-12;修回日期:2017-06-14 基金项目:国家自然科学基金项目(71671015,61304177) 作者简介:闫小勇,副教授,研究方向为复杂网络和出行行为复杂性,电子信箱:yany@bjtu.edu.cn 引用格式:闫小勇.空间交互网络研究进展!科技导报,2017,35(14:15-22:di:10.981/isn.1000-78572017.14.00 15
科技导报 2017,35(14) www.kjdb.org 收稿日期:2017-05-12;修回日期:2017-06-14 基金项目:国家自然科学基金项目(71671015,61304177) 作者简介:闫小勇,副教授,研究方向为复杂网络和出行行为复杂性,电子信箱:yanxy@bjtu.edu.cn 引用格式:闫小勇. 空间交互网络研究进展[J]. 科技导报, 2017, 35(14): 15-22; doi: 10.3981/j.issn.1000-7857.2017.14.001 空间交互网络研究进展 闫小勇 北京交通大学交通系统科学与工程研究院,北京 100044 摘要 空间交互网络是人、商品和信息等在地点之间流动而形成的嵌入在空间中的有向流网络。典型的空间交互网络包括国际 贸易网络、人口迁移网络、人群出行网络及电话通信网络等。理解和预测空间交互网络中的流量分布模式不仅是区域科学、交通 科学、经济地理学等很多领域长期以来的一个重要研究主题,在城市和交通规划、疾病传播防控、商业服务等领域也具有广泛应 用价值。本文在简要介绍引力模型、介入机会模型等经典空间交互模型的基础上,着重对近年来复杂系统研究领域在空间交互 网络建模方面的研究成果进行介绍,包括辐射模型、人口权重机会模型及空间交互网络上的随机游走模型等,并且对空间交互网 络研究中存在的挑战性问题进行探讨,包括个体多样性行为建模、群体空间交互决策行为实验、数据驱动的活动-出行行为 研究等。 关键词 空间交互;复杂网络;人类移动模式;出行分布预测 空间交互是指人、商品和信息等在地点之间的流动[1] ,这 种流动自然形成了嵌入在地理空间中的有向流网络——空 间交互网络[2] 。空间交互网络在日常生活中无处不在:身处 不同城市的人们通过电话、社交App 等进行沟通联络,形成 了以城市为节点、电话或网络通信量为边权的通信网络[3] ;不 同国家之间进行商品贸易,形成了以国家为节点、贸易量或 物流量为边权的贸易网络[4] 。更直接的例子则是人类自身的 移动:在长时间尺度上,人口在城市或国家之间流动,形成了 人口迁移网络[5] ;而在短时间尺度上,每天进行的出行活动形 成了人群出行网络[6] 。显然,研究这些空间交互网络上的流 量模式形成机制、预测这些网络上的连边交互强度等都是具 有重要价值的问题。这些问题的研究对于制订区域经济和 人口发展政策、规划和管理交通、通信等基础设施网络、预防 和控制流行病的传播、提供基于位置的商业服务等具有重要 的实际意义[7-8] 。 空间交互网络研究中一个基本问题是:在已知各地点的 人口(或经济产值、流出总量等反映地点体量差异的指标)和 地点之间距离(或移动成本、出行时间等反映地点之间阻隔 程度的指标)等数据的前提下,预测地点之间空间交互的强 度(即流量)。解决这类问题的模型在区域科学和经济地理 学中被称为空间交互模型[1] ,而在交通科学中则被称为出行 分布预测模型[9-10] 。早在100多年前,研究者们就发现在人群 出行网络、人口迁移网络、商品贸易网络等空间交互网络中 普遍存在着引力定律[11-16] ,即网络节点之间的交互强度近似 正比于节点强度乘积与节点间距离幂函数的比值。而类比 牛顿万有引力定律提出的空间交互引力模型[17] ,也自然地成 为解释和预测空间网络交互强度的经典模型,被广泛应用于 包括交通规划[9-10] 、人口迁移[5] 、国际贸易[4,18] 、通信网络[3] 甚至 在线商品推荐[19] 等在内的诸多领域中。进入21世纪后,随着 手机、全球定位系统(GPS)、移动互联网等现代信息通信技术 的飞速发展,大规模、高精度的人类空间交互数据的可获取 程度不断提高,一些数据驱动的空间交互新模型不断涌现, 极大地丰富和发展了空间交互网络研究的理论与方法。本 文将简要介绍经典的空间交互模型引力模型,并重点对近年 来统计物理和复杂系统研究领域在空间交互网络建模方面 的一些研究成果进行介绍。 1 空间交互引力模型 1.1 引力模型及其扩展 引力模型是最早被提出的空间交互强度预测模型[1,17] ,其 基本假设是两地之间(人口、出行、贸易等)的交互量与两地 的人口数成正比,与两地间距离的幂函数成反比 Tij = α mimj dβ ij (1) 式中,Tij为从起点i到终点j的流量;mi和mj分别为起终点的人 口数;dij为两者间的距离;α,β为2个可调参数,需要根据实际 15
www.kjdb.org 科技导报2017,35(14) 导报 数据进行估计叫。 没有被第j个地点所吸引的概率,则可以得到关系式 式(1)中原始的引力模型无法保证预测所得到的流量矩 (5) 阵T满足起点流出总量O=∑的约束以及终点流入总量它等价于 D=∑T的约束,因此研究者又发展出了双约束引力模型叫 9-=-am,=-a(S4-S-) (6) (2) 式中,)为阻抗函数,一般可取距离(或广义出行成本)的幂式中,S为地点到之间包含和点)的总人口数量。将q 函数、负指数函数、幂指复合型函数“等形式門,和S视为连续变量,则式(6)可写成微分方程 412BD(4)和B=/∑A/(4)为2个平衡因子,解此方程可得到 它们在迭代计算中产生,目的是使得模型预测结果同时满足 流出和流入总量约東 引力模型具有形式简单、概念易懂的优点,是目前被应多为总人口数量。由于从点出发被点吸引的总出行 1.2引力模型的统计物理解释 式中 用最为广泛的空间交互模型叫。但引力模型是类比物理中的 r,=(s-)-q(S 万有引力定律提出的,缺乏严格的理论依据。 Wilson四以出 综合式(7)、(8)可得 行者目的地选择问题为背景,提出了一种从最大熵原理导出 -" 引力模型的方法:在给定出行总成本约束C=∑∑T、出 (9) 行总量约束=∑和D=∑7,的条件下,系统出行分布这即为介入机会模型 的微观状态数为 与引力模型相比,介入机会模型的假设中体现了个体选 7 (3)择目的地时的行为决策过程,是一个微观机制类模型。但介 入机会模型在形式上比引力模型更为复杂,且容易低估长距 根据统计物理中的最大熵原理,系统最可能出现的出离出行的比例叫,因此在实际中并未获得广泛应用,但介入机 行分布是微观状态数最多的分布(最可几分布)。用拉格朗会模型中提出了一个非常重要的思想:用排序而不是真实的 日乘数法求解式(3)中的约束极值问题,可以得到 空间距离来度量各目的地距离起点的远近,这一思想直接启 T=A B ODe (4)发了后续的大量研究工作。 恰好是个带有指数出行成本函数的双约束引力模型。研究叫22辐射模型 发现,混合交通方式出行者的出行成本与距离具有 在包括引力模型、介入机会模型在内的空间交互经典模 近似对数关系c=nm+u,+,代入式(4)中得到型中,普遍存在的一个问题是包含待估参数,必须用历史的 T≈ABOD,能够覆盖大多数实证中观测到的引力模空间交互流量数据估计模型参数之后才能实施预测。但通 常地点之间详实的流量数据难以获取,这在很大程度上限制 型距离函数。 Wm最大原理为引力模型建立了一个统计物理的出了一个名为辐射模型的空间交互模型它的基本假设是个 理论基础。但是,统计物理中的最大熵模型并不是一个机制体在选择目的地时,会选择距起点最近且比起点收益(收益 模型,它仅能给出系统最可能的宏观分布状态,无法对系统 中个体的微观决策过程进行描述凹,同时系统的总成本约東 值按正比于地点人口数随机抽取)更多的一个地点移动。辐 射模型的原始推导过程可见文献[27的补充材料,本文给出 从何而来也并不清楚叫。从个体空间交互决策行为的角度 一种更简单直观的推导方式 引力模型的低层机制仍未得到满意解答P=。 前已述及,介入机会模型假设出行者被地点j吸引的概 率是am2(即正比于j的人口数)。如果假设这一概率正比于 2空间交互行为决策模型 2.1介入机会模型 目的地人口数与起终点之间人口总数的比值,则可以得 与类比物理定律得来的引力模型不同介入机会模型叫到从点出发的出行没有被第个地点所吸引的概率为 完全是从个体对目的地选择的决策过程出发提出模型假设 的。其基本假设是:对于每个从地点i出发的出行者,先将所 有目的地按照距离地点i由近及远的顺序排序,并假设出行 进一步可得从i点出发的出行被第j个地点所吸引的概率为 者会以固定的概率P被某个地点的机会所吸引,并停留在那 里。如果假设地点j的机会数正比于人口数m,则出行者被 地点吸引的概率可假设为am。令表示从i点出发的出行该模型中出行者的目的地选择过程非常类似物理中的粒子
www.kjdb.org 科技导报 2017,35(14) 数据进行估计[20] 。 式(1)中原始的引力模型无法保证预测所得到的流量矩 阵T满足起点流出总量 Oi =∑j Tij 的约束以及终点流入总量 Dj =∑i Tij 的约束,因此研究者又发展出了双约束引力模型[10] Tij = AiBj OiDj f (dij) (2) 式中,f(dij)为阻抗函数,一般可取距离(或广义出行成本)的幂 函数 d -β ij 、负指数函数 e -βdij 、幂指复合型函数 dα ije -βdij 等形式[9] , Ai =1∑jBjDj f (dij) 和 Bj =1∑iAi Oi f (dij) 为 2 个平衡因子, 它们在迭代计算中产生,目的是使得模型预测结果同时满足 流出和流入总量约束。 1.2 引力模型的统计物理解释 引力模型具有形式简单、概念易懂的优点,是目前被应 用最为广泛的空间交互模型[1] 。但引力模型是类比物理中的 万有引力定律提出的,缺乏严格的理论依据[21] 。Wilson[22] 以出 行者目的地选择问题为背景,提出了一种从最大熵原理导出 引力模型的方法:在给定出行总成本约束 C =∑∑i j Tijcij 、出 行总量约束 Oi =∑j Tij 和 Dj =∑i Tij 的条件下,系统出行分布 的微观状态数为 Ω= T! ∏ij Tij! (3) 根据统计物理中的最大熵原理[22] ,系统最可能出现的出 行分布是微观状态数最多的分布(最可几分布)。用拉格朗 日乘数法求解式(3)中的约束极值问题,可以得到 Tij = AiBj OiDj e -βcij (4) 恰好是个带有指数出行成本函数的双约束引力模型。研究[23] 发 现 ,混 合 交 通 方 式 出 行 者 的 出 行 成 本 与 距 离 具 有 近 似 对 数 关 系 cij ≈ ηlndij + μdij + ψ ,代 入 式(4)中 得 到 Tij ≈ AiBj OiDjdα ije -βdij ,能够覆盖大多数实证中观测到的引力模 型距离函数[7-8] 。 Wilson 最大熵原理为引力模型建立了一个统计物理的 理论基础。但是,统计物理中的最大熵模型并不是一个机制 模型,它仅能给出系统最可能的宏观分布状态,无法对系统 中个体的微观决策过程进行描述[22] ,同时系统的总成本约束 从何而来也并不清楚[24] 。从个体空间交互决策行为的角度, 引力模型的低层机制仍未得到满意解答[21,24] 。 2 空间交互行为决策模型 2.1 介入机会模型 与类比物理定律得来的引力模型不同,介入机会模型[25] 完全是从个体对目的地选择的决策过程出发提出模型假设 的。其基本假设是:对于每个从地点i出发的出行者,先将所 有目的地按照距离地点i由近及远的顺序排序,并假设出行 者会以固定的概率P被某个地点的机会所吸引,并停留在那 里。如果假设地点j的机会数正比于人口数mj,则出行者被 地点j吸引的概率可假设为αmj。令 q j i 表示从i点出发的出行 没有被第j个地点所吸引的概率,则可以得到关系式 q j i = q j - 1 i (1 - αmj) (5) 它等价于 q j i - q j - 1 i q j - 1 i = -αmj = -α(Sij - Si,j - 1) (6) 式中,Sij为地点i到j之间(包含i和j点)的总人口数量。将q 和 S 视为连续变量,则式(6)可写成微分方程 dq qi(S) = -αdS 。 解此方程可得到 qi(S) = e -αS 1 - e -αM (7) 式中,M为总人口数量。由于从i点出发被j点吸引的总出行 量为 Tij = Oi[qi(Si,j - 1) - qi(Sij)] (8) 综合式(7)、(8)可得 Tij = Oi e -α(Sij - mj) - e -αSij 1 - e -αM (9) 这即为介入机会模型。 与引力模型相比,介入机会模型的假设中体现了个体选 择目的地时的行为决策过程,是一个微观机制类模型。但介 入机会模型在形式上比引力模型更为复杂,且容易低估长距 离出行的比例[26] ,因此在实际中并未获得广泛应用,但介入机 会模型中提出了一个非常重要的思想:用排序而不是真实的 空间距离来度量各目的地距离起点的远近,这一思想直接启 发了后续的大量研究工作。 2.2 辐射模型 在包括引力模型、介入机会模型在内的空间交互经典模 型中,普遍存在的一个问题是包含待估参数,必须用历史的 空间交互流量数据估计模型参数之后才能实施预测。但通 常地点之间详实的流量数据难以获取,这在很大程度上限制 了这些经典模型的适用范围。针对这一问题,Simini 等[27] 提 出了一个名为辐射模型的空间交互模型,它的基本假设是个 体在选择目的地时,会选择距起点最近且比起点收益(收益 值按正比于地点人口数随机抽取)更多的一个地点移动。辐 射模型的原始推导过程可见文献[27]的补充材料,本文给出 一种更简单直观的推导方式。 前已述及,介入机会模型假设出行者被地点j吸引的概 率是αm(j 即正比于j的人口数)。如果假设这一概率正比于 目的地人口数与起终点之间人口总数的比值 mj Sij ,则可以得 到从i点出发的出行没有被第j个地点所吸引的概率为 q j i = q j - 1 i æ è ç ö ø 1 - ÷ mj Sij =∏j Si,j - 1 Sij = mj Sij (10) 进一步可得从i点出发的出行被第j个地点所吸引的概率为 Pij = q j - 1 i mj Sij = mimj Si,j - 1Sij (11) 该模型中出行者的目的地选择过程非常类似物理中的粒子 16
科技导报2017,35(14) www.kjdb.org 导报 辐射过程:粒子(出行者)从一个源头(出行起点)向外四散,口分布数据就可以相当准确地预测空间交互网络流量,克服 可以被环境以一定概率吸收(选择了某个终点),而粒子行进了引力模型等经典模型中存在的缺陷。但是,辐射模型假定 的距离(出行距离的长度)则依赖于材料的厚度(人口密个体在选择目的地时只选择距自己最近的高收益地点出行, 度)。因此 Siming等将这一模型命名为辐射模型。 这使得其预测结果在一些情况下与实际有较大的偏差。图1 由式(11)可以看到,辐射模型需要的输入数据只有各地显示了用北京市出租车GPS数据进行的对比。图1(a)-(ec) 的人口数量,而不包含任何可调整的参数。换句话说,该模显示的是从一个位于市中心的地点出发、在不同地点下车的 型仅需要输入人口分布数据就能实施空间交互强度预测,显人数分布;图1(d)-()显示的是从一个位于南四环的地点出 示出了巨大的应用优势。文献27通过一系列实际数据验证「发、在不同地点下车的人数分布;最左列是辐射模型的预测 了这一模型的预测效果,结果表明辐射模型能够相当准确地结果,中间一列是实际的出租车乘客移动模式最右列是人 预测城市间的通勤出行量、人口迁移量和货物运输量等。 口权重机会( population- weighted opportunity,PWO)模型的预 23人口权重机会模型 测结果。从图1中可以看出,辐射模型预测的人群移动范围 辐射模型的突出特点是不需要任何可调参数、仅输入人明显小于真实情况。 (a) (c) 辐射模型 实际移动模式 人口权重机会模型 图1北京市出租车乘客实际移动模式与辐射模型、人口权重机会模型预测结果的对比 Fig. 1 Comparing the observed mobility patterns of Beijing taxi passengers with the mobility patterns predicted 研究认为,出行者在选择目的地时不是仅考虑距离起点 最近的高收益目的地,而是会综合衡量备选空间范围内所有 S 潜在目的地的收益(或机会数)。一般而言,对于具有相同机将这一模型命名为人口权重机会模型。与辐射模型类似 会数的目的地来说,出行者更倾向于选择近的目的地;而对PWO模型中所需要的输入数据仅仅是各地点的人口分布同 于距离相近的目的地来说机会数多的地点对出行者的吸引样不存在可调参数。为验证这一形式异常简单的PWO模型 力更大。换句话说,一个地点被出行者所感受的机会数是该的预测效果收集了14个城市的人群移动量数据既包括传 地点的实际机会数按某种方式衰减后剩余的部分。引力模统的居民出行调查数据(5个美国城市),也包括新型的人群 型中用一个阻抗函数描述这种衰减叫但这一函数中不可避移动轨迹数据如手机用户数据(1个非洲城市)社交网络签 免地要引入可调参数。是否存在更自然的不依赖于具体参到数据(6个欧洲城市)和出租车GPS数据(2个中国城市)。 数的方式描述这种机会衰减现象,文献29提出了一个新的从图1中可以看出,PWO模型对北京出租车乘客群体出行模 衰减机制,认为个体在选择目的地的时候会考虑起终点之间式的预测结果与实际数据显示出的结果十分接近。图2为在 其他个体(见图1()中的插入图)对目的地机会数的竞争效14个案例城市中用PWO模型和辐射模型进行移动量预测的 应。为体现这种竞争效应,假设出行者选择一个目的地的概准确率对比,从中可以看到PWO模型的预测准确率在所有案 率正比于目的地的机会数(假设为正比于人口数),反比于出例中都高于辐射模型。尽管这些城市在人口数量和城市 行者所在地点到目的地之间的人口总数 模、社会文化背景、经济发展水平等方面是非常多样化的,但
科技导报 2017,35(14) www.kjdb.org 辐射过程:粒子(出行者)从一个源头(出行起点)向外四散, 可以被环境以一定概率吸收(选择了某个终点),而粒子行进 的距离(出行距离的长度)则依赖于材料的厚度(人口密 度)[28] 。因此Simini等将这一模型命名为辐射模型。 由式(11)可以看到,辐射模型需要的输入数据只有各地 的人口数量,而不包含任何可调整的参数。换句话说,该模 型仅需要输入人口分布数据就能实施空间交互强度预测,显 示出了巨大的应用优势。文献[27]通过一系列实际数据验证 了这一模型的预测效果,结果表明辐射模型能够相当准确地 预测城市间的通勤出行量、人口迁移量和货物运输量等。 2.3 人口权重机会模型 辐射模型的突出特点是不需要任何可调参数、仅输入人 口分布数据就可以相当准确地预测空间交互网络流量,克服 了引力模型等经典模型中存在的缺陷。但是,辐射模型假定 个体在选择目的地时只选择距自己最近的高收益地点出行, 这使得其预测结果在一些情况下与实际有较大的偏差。图1 显示了用北京市出租车GPS数据进行的对比。图1(a)~(c) 显示的是从一个位于市中心的地点出发、在不同地点下车的 人数分布;图1(d)~(f)显示的是从一个位于南四环的地点出 发、在不同地点下车的人数分布;最左列是辐射模型的预测 结果,中间一列是实际的出租车乘客移动模式,最右列是人 口权重机会(population-weighted opportunity,PWO)模型的预 测结果。从图1中可以看出,辐射模型预测的人群移动范围 明显小于真实情况。 图1 北京市出租车乘客实际移动模式与辐射模型、人口权重机会模型预测结果的对比 Fig. 1 Comparing the observed mobility patterns of Beijing taxi passengers with the mobility patterns predicted 研究认为,出行者在选择目的地时不是仅考虑距离起点 最近的高收益目的地,而是会综合衡量备选空间范围内所有 潜在目的地的收益(或机会数)。一般而言,对于具有相同机 会数的目的地来说,出行者更倾向于选择近的目的地;而对 于距离相近的目的地来说,机会数多的地点对出行者的吸引 力更大。换句话说,一个地点被出行者所感受的机会数是该 地点的实际机会数按某种方式衰减后剩余的部分。引力模 型中用一个阻抗函数描述这种衰减[10] ,但这一函数中不可避 免地要引入可调参数。是否存在更自然的、不依赖于具体参 数的方式描述这种机会衰减现象,文献[29]提出了一个新的 衰减机制,认为个体在选择目的地的时候会考虑起终点之间 其他个体(见图1(f)中的插入图)对目的地机会数的竞争效 应。为体现这种竞争效应,假设出行者选择一个目的地的概 率正比于目的地的机会数(假设为正比于人口数),反比于出 行者所在地点到目的地之间的人口总数 Pij ∝ mj Sji (12) 将这一模型命名为人口权重机会模型。与辐射模型类似, PWO模型中所需要的输入数据仅仅是各地点的人口分布,同 样不存在可调参数。为验证这一形式异常简单的PWO模型 的预测效果,收集了14个城市的人群移动量数据,既包括传 统的居民出行调查数据(5个美国城市),也包括新型的人群 移动轨迹数据如手机用户数据(1个非洲城市)、社交网络签 到数据(6 个欧洲城市)和出租车 GPS 数据(2 个中国城市)。 从图1中可以看出,PWO模型对北京出租车乘客群体出行模 式的预测结果与实际数据显示出的结果十分接近。图2为在 14个案例城市中用PWO模型和辐射模型进行移动量预测的 准确率对比,从中可以看到PWO模型的预测准确率在所有案 例中都高于辐射模型。尽管这些城市在人口数量和城市规 模、社会文化背景、经济发展水平等方面是非常多样化的,但 辐射模型 实际移动模式 人口权重机会模型 17
www.kjdb.org 科技导报2017,35(14) 导报 PWO模型却取得了十分稳定的预测效果(准确率在70%左|计的结果上得到印证—在这些城市中估计的引力模型幂 右),说明这一模型或许捕捉到了与具体城市背景无关的人指数范围介于1.63-2.43之间,更接近简化PWO模型中的幂 群移动模式形成的普遍机制。 指数2,但与简化辐射模型中的幂指数4则相距甚远 类似地,在人口均匀分布的假设下也可以把介入机会模 型简化为 PwO radiation ,m(e-lw吗 式(16)同样是一个类引力模型的形式,其中阻抗函数是距离 的二阶指数函数,说明长距离出行产生的概率极低,这可能 正是介入机会模型低估长距离出行的主要原因。 通过上述对各种模型的分析可知,在人口均匀分布的假 设下,PWO模型、辐射模型、介入机会模型都可以转化为某种 北深阿芝纽西底双伦桕布奥哥哥 京圳比加约雅特子敦林拉斯本德 形式的引力模型。这说明,尽管这些模型基于不同的假说提 格陆哈堡 出,但它们具有非常类似的底层机制。可以把这种机制归纳 为:个体选择一个目的地的概率会随着某种阻挠因素的增加 图2人口权重机会模型与辐射模型整体预测精度对比 而下降,在引力模型中,这种阻挠因素是空间距离,而在介人 Fg.2 Comparison between the prediction ability of the机会模型、辐射模型和pWO模型中,这种阻挠因素是地点间 PWO and radiation models 的人口数量。不同的是,在引力模型和介入机会模型中,需 要一个带参数的阻抗函数来描述目的地选择概率随阻挠因 24几种模型的内在联系 素增加而下降的过程,而在辐射模型和PWO模型中,目的地 前述分别介绍了引力模型介入机会模型辐射模型和选择概率是随着地点间人口数的增加而自然衰减的。 PWO模型的基本原理。本节将进一步探讨这几种模型的内 在联系,以深化对这些模型底层机制的理解。 3空间交互网络上的随机游走模型 首先考虑地点人口数均匀分布这样一种极端简化的情31空间随机游走模型概述 形,在这种情况下显然有 第2节介绍的介人机会模型、辐射模型和PWO模型都是 S:=S,=pd- (13)从个体目的地选择决策行为出发提出相关假设,通过输入人 式中p为人口密度。将式(13代入式(12),可以得出人口均口分布、空间距离等数据预测地点间的空间交互流量矩阵。 匀分布情况下的简化PWO模型 但这些模型本质上都是静态模型,缺乏对个体连续移动过程 (14)的刻画,因而无法再现个体移动轨迹的时空统计模式,例如 地点访问频率的异质性分布和访问地点的异速增长现象 与式(1)进行对比,可以看出式(14)是一个带有平方阻等。在研究人口迁移居住或就业地选址等长时间尺度的空 抗函数的引力模型。有趣的是,简化的PwO模型与牛顿万有间交互行为时,使用这类静态模型没有问题。但在研究出行 引力定律具有几乎一样的形式。由于实际空间中人口肯定者交通行为疾病时空传播过程、点对点通信网络设 是异质性分布的,因此在引力模型中不能直接使用平方阻抗计等问题时,需要详细刻画个体在空间中的连续移动过 函数,必须要用实际数据来估计引力模型的参数。但却可以程,此时静态模型不再适用。因此,对个体的空间连续移动 直接使用PWO模型中的人口函数作为阻抗函数,因为人过程进行建模,也是空间交互网络研究中的一个重要问题。 口的异质性已经被反映在S中叫 传统上,处理粒子扩散过程的标准模型是二维随机游走 在人口均匀分布的假设下,也可以将式(1)中的辐射模模型,而列维飞行模型(一种带有无尺度步长分布的随机游 改写为 走模型)则被广泛应用于对动物移动行为的建模。近年来, T 随着人类移动轨迹数据可获取程度的提高,人们可以用更翔 实的数据探究自身的空间移动规律。这方面的研究始于 式(15)是一个带有4次方阻抗函数的引力模型。与简化的 Brockmann等于2000年发表在《Nam)上的开创性工作,他 PWO模型相比简化辐射模型的幂指数更大说明个体选择们利用美元流通记录网站的数据间接对人类空间移动行为 远距离目的地出行的概率更低。这是导致辐射模型在预测进行了实证统计,并用连续时间随机游走模型甽再现了美元 城市人群移动模式时精度不高的原因之一,因为在城市中人流通的低速扩散特征。随后,ong等叶又从对手机数据所 群的出行选择范围显然比辐射模型预言的要大得多(图1)。进行的统计实证中发现人类的空间移动模式中存在着一些 这一点也可以从文献26中对8个城市进行引力模型参数估无法用连续时间随机游走模型解释的标度异常现象,例如访
www.kjdb.org 科技导报 2017,35(14) PWO 模型却取得了十分稳定的预测效果(准确率在 70%左 右),说明这一模型或许捕捉到了与具体城市背景无关的人 群移动模式形成的普遍机制。 2.4 几种模型的内在联系 前述分别介绍了引力模型、介入机会模型、辐射模型和 PWO模型的基本原理。本节将进一步探讨这几种模型的内 在联系,以深化对这些模型底层机制的理解。 首先考虑地点人口数均匀分布这样一种极端简化的情 形,在这种情况下显然有 Sji = Sij = ρπd2 ij (13) 式中,ρ为人口密度。将式(13)代入式(12),可以得出人口均 匀分布情况下的简化PWO模型 Tij ∝ mimj d2 ij (14) 与式(1)进行对比,可以看出式(14)是一个带有平方阻 抗函数的引力模型。有趣的是,简化的PWO模型与牛顿万有 引力定律具有几乎一样的形式。由于实际空间中人口肯定 是异质性分布的,因此在引力模型中不能直接使用平方阻抗 函数,必须要用实际数据来估计引力模型的参数。但却可以 直接使用PWO模型中的人口函数1/Sji作为阻抗函数,因为人 口的异质性已经被反映在Sji中[29] 。 在人口均匀分布的假设下,也可以将式(11)中的辐射模 型改写为 Tij ∝ mimj d4 ij (15) 式(15)是一个带有 4 次方阻抗函数的引力模型。与简化的 PWO模型相比,简化辐射模型的幂指数更大,说明个体选择 远距离目的地出行的概率更低。这是导致辐射模型在预测 城市人群移动模式时精度不高的原因之一,因为在城市中人 群的出行选择范围显然比辐射模型预言的要大得多(图1)。 这一点也可以从文献[26]中对8个城市进行引力模型参数估 计的结果上得到印证——在这些城市中估计的引力模型幂 指数范围介于1.63~2.43之间,更接近简化PWO模型中的幂 指数2,但与简化辐射模型中的幂指数4则相距甚远。 类似地,在人口均匀分布的假设下也可以把介入机会模 型简化为 Tij ∝ mi(e ) αmj - 1 e -αρπd2 ij (16) 式(16)同样是一个类引力模型的形式,其中阻抗函数是距离 的二阶指数函数,说明长距离出行产生的概率极低,这可能 正是介入机会模型低估长距离出行的主要原因。 通过上述对各种模型的分析可知,在人口均匀分布的假 设下,PWO模型、辐射模型、介入机会模型都可以转化为某种 形式的引力模型。这说明,尽管这些模型基于不同的假说提 出,但它们具有非常类似的底层机制。可以把这种机制归纳 为:个体选择一个目的地的概率会随着某种阻挠因素的增加 而下降,在引力模型中,这种阻挠因素是空间距离,而在介入 机会模型、辐射模型和PWO模型中,这种阻挠因素是地点间 的人口数量。不同的是,在引力模型和介入机会模型中,需 要一个带参数的阻抗函数来描述目的地选择概率随阻挠因 素增加而下降的过程,而在辐射模型和PWO模型中,目的地 选择概率是随着地点间人口数的增加而自然衰减的。 3 空间交互网络上的随机游走模型 3.1 空间随机游走模型概述 第2节介绍的介入机会模型、辐射模型和PWO模型都是 从个体目的地选择决策行为出发提出相关假设,通过输入人 口分布、空间距离等数据预测地点间的空间交互流量矩阵。 但这些模型本质上都是静态模型,缺乏对个体连续移动过程 的刻画,因而无法再现个体移动轨迹的时空统计模式,例如 地点访问频率的异质性分布和访问地点的异速增长现象[30-32] 等。在研究人口迁移、居住或就业地选址等长时间尺度的空 间交互行为时,使用这类静态模型没有问题。但在研究出行 者交通行为[9-10] 、疾病时空传播过程[33-34] 、点对点通信网络设 计[35-36] 等问题时,需要详细刻画个体在空间中的连续移动过 程,此时静态模型不再适用。因此,对个体的空间连续移动 过程进行建模,也是空间交互网络研究中的一个重要问题。 传统上,处理粒子扩散过程的标准模型是二维随机游走 模型[37] ,而列维飞行模型(一种带有无尺度步长分布的随机游 走模型)则被广泛应用于对动物移动行为的建模[38] 。近年来, 随着人类移动轨迹数据可获取程度的提高,人们可以用更翔 实的数据探究自身的空间移动规律。这方面的研究始于 Brockmann等[30] 于2006年发表在《Nature》上的开创性工作,他 们利用美元流通记录网站的数据间接对人类空间移动行为 进行了实证统计,并用连续时间随机游走模型[39] 再现了美元 流通的低速扩散特征。随后,Song等[31-32] 又从对手机数据所 进行的统计实证中发现人类的空间移动模式中存在着一些 无法用连续时间随机游走模型解释的标度异常现象,例如访 图2 人口权重机会模型与辐射模型整体预测精度对比 Fig. 2 Comparison between the prediction ability of the PWO and radiation models 18
科技导报2017,35(14) www.kjdb.org 导报 问地点数量S()随着时间亚线性增长、地点访问频率分布服 从齐普夫律等,并建立了一个探索和偏好返回模型凹解释这 些现象。关于个体空间移动模式建模的更多详细介 绍可见文献8],本文重点介绍作者最近在空间网络随机游走 建模方面的一些研究进展。 3.2记忆性随机游走模型 之前的很多实证研究都发现,人类个体在空间移动 (1+·k 过程中具有强烈的记忆性——个体总是倾向于很快就返回 之前访问过的一个地点。Sze等在他们的工作中已经意识 到了记忆性对人类个体移动行为的重要影响,他们直接使用 图3记忆性随机游走模型示意 返回时间间隔分布P(T)作为建模假设,即个体每次从该分布 Fig. 3 Illustration of memory-preferential random 中抽取一个间隔τ来决定返回之前l步曾访问的地点。该模 walk model 型能够生成和实际一致的访问地点增长速度0,但本文认式中,为地点B已被访向过的次数,A为记忆强度因子。当 为这是用一个现象去解释另一个现象,并没有触及个体移动 λ=0时,式(17)退化为一般的无记忆随机游走模型;当A>0 行为的本质机制。而探索和偏好返回模型啊假设个体在移时,个体会对已访问地点形成记忆性。随着个体访问地点数 动过程中会以一定的概率Px访问一个新地点即随着访量的增多,已访问过地点的总吸引力就相对越来越强,因此 问地点数量S的增加个体越来越不倾向于访问新地点,而更个体访问新地点的可能性自然就降低了 倾向于在已访问过的地点之间移动),同时以概率1-P返回 对记忆性随机游走模型进行定量解析分析和实际数据 之前访问过的一个地点,选择某个已访问地点的概率正比于验证结果表明它能很好地再现个体返回时间间隔的异质性 该地点之前已被访问过的频率。探索和偏好返回模型能够 分布、地点访问频率服从齐普夫律和访问地点的亚线性增长 生成和实际数据相符合的地点访问频率分布和基本符合实这些重要的时空统计模式。同时,记忆性偏好游走模型不仅 际的地点增长速度曲线(因为该模型只能再现S0增长曲线能对真实地理空间中的个体移动行为进行建模还能再现虚 的尾部特征但是该模型中却无法解释为什么个体扩展新报空间中个体跳转行为的时空统计转征吗 地点的概率P会依访问地点数S的增加而下降。 3.3个体和群体移动模式预测的统一模型 本文认为,造成这种现象的可能原因是个体在移动过程 前已述及,包括记忆性随机游走模型在内的个体移动模 中会对已经访问过的地点形成记忆性偏好,这种记忆性偏好型即,只能再现个体空间移动网络的各种时空统计特 会随着个体对一个地点的访问次数增加而得到不断强化。征,但无法直接用于对空间交互网络流量分布模式的预测 基于这些思考,建立在有限空间中的记忆性偏好随机游走模 而引力模型、辐射模型等空间交互模型,又无法用于对个体 型(图3.在该模型中,位于点的个体在每步随机游走过程连续移动轨迹的刻画。事实上,无论是个体空间移动网络 中,按照式(17)中的概率随机访问地点β 还是群体空间交互网络,它们都由同一群个体的移动行为所 P。9∝1+Ak 产生(图4),只是对网络时空特征的统计角度有所不同。因 中国大陆 美国大陆 科特迪瓦(d 比利时 图4个体空间移动网络和群体空间交互网络的关系 Fig 4 Relationship between individual mobility networks and collective spatial interaction networks 19
科技导报 2017,35(14) www.kjdb.org 问地点数量S(t)随着时间亚线性增长、地点访问频率分布服 从齐普夫律等,并建立了一个探索和偏好返回模型[32] 解释这 些现象。关于个体空间移动模式建模 [30-32,40-43] 的更多详细介 绍可见文献[8],本文重点介绍作者最近在空间网络随机游走 建模方面的一些研究进展。 3.2 记忆性随机游走模型 之前的很多实证研究[31-32,43] 都发现,人类个体在空间移动 过程中具有强烈的记忆性——个体总是倾向于很快就返回 之前访问过的一个地点。Szell等[43] 在他们的工作中已经意识 到了记忆性对人类个体移动行为的重要影响,他们直接使用 返回时间间隔分布P(τ)作为建模假设,即个体每次从该分布 中抽取一个间隔τ来决定返回之前l步曾访问的地点。该模 型能够生成和实际一致的访问地点增长速度S(t),但本文认 为这是用一个现象去解释另一个现象,并没有触及个体移动 行为的本质机制。而探索和偏好返回模型[32] 则假设个体在移 动过程中会以一定的概率 P ∝S -γ 访问一个新地点(即随着访 问地点数量S的增加,个体越来越不倾向于访问新地点,而更 倾向于在已访问过的地点之间移动),同时以概率1-P返回 之前访问过的一个地点,选择某个已访问地点的概率正比于 该地点之前已被访问过的频率。探索和偏好返回模型能够 生成和实际数据相符合的地点访问频率分布和基本符合实 际的地点增长速度曲线(因为该模型只能再现S(t)增长曲线 的尾部特征)。但是该模型中却无法解释为什么个体扩展新 地点的概率P会依访问地点数S的增加而下降。 本文认为,造成这种现象的可能原因是个体在移动过程 中会对已经访问过的地点形成记忆性偏好,这种记忆性偏好 会随着个体对一个地点的访问次数增加而得到不断强化。 基于这些思考,建立在有限空间中的记忆性偏好随机游走模 型(图3)。在该模型中,位于点的个体在每步随机游走过程 中,按照式(17)中的概率随机访问地点β pα → β ∝1 + λkβ (17) 式中,kβ为地点β已被访问过的次数,λ为记忆强度因子。当 λ=0时,式(17)退化为一般的无记忆随机游走模型;当λ>0 时,个体会对已访问地点形成记忆性。随着个体访问地点数 量的增多,已访问过地点的总吸引力就相对越来越强,因此 个体访问新地点的可能性自然就降低了。 对记忆性随机游走模型进行定量解析分析和实际数据 验证,结果表明它能很好地再现个体返回时间间隔的异质性 分布、地点访问频率服从齐普夫律和访问地点的亚线性增长 这些重要的时空统计模式。同时,记忆性偏好游走模型不仅 能对真实地理空间中的个体移动行为进行建模,还能再现虚 拟空间中个体跳转行为的时空统计特征[45] 。 3.3 个体和群体移动模式预测的统一模型 前已述及,包括记忆性随机游走模型在内的个体移动模 型[30-32,40-45] ,只能再现个体空间移动网络的各种时空统计特 征,但无法直接用于对空间交互网络流量分布模式的预测; 而引力模型、辐射模型等空间交互模型,又无法用于对个体 连续移动轨迹的刻画。事实上,无论是个体空间移动网络, 还是群体空间交互网络,它们都由同一群个体的移动行为所 产生(图4),只是对网络时空特征的统计角度有所不同。因 图3 记忆性随机游走模型示意 Fig. 3 Illustration of memory-preferential random walk model 图4 个体空间移动网络和群体空间交互网络的关系 Fig. 4 Relationship between individual mobility networks and collective spatial interaction networks 19