对各种人类出行数据的统计实证发现,人类空间运动模式中存在许多共有的统计特性,暗示着可能存在某种普适性机制支配人类空间移动[1–2]。通过建立移动模型描述人类空间移动行为,有助于揭示各种统计现象和标度律的形成机制,加深对人类空间移动行为的理解[3–5]。在个体移动模型研究方面有很多经典模型,比如,随机游走模型[6]、自相似最少活动游走模型[7]、偏好返回模型[8]。还有一些考虑人类活动习惯[9–11]和社交影响[12–14]的模型。在群集移动模型研究方面:传统的引力模型[15]不仅需要众多参数,且对两地客流量的预测不能得到正确的结果;Simini等[16]提出了一个“无参”的辐射模型,该模型考虑了附近区域的人口密度和人口流动的方向性,对区域间人口流动量的预测效果优于引力模型。从上述分析可知,现有个体移动模型可以有效解释人类空间移动统计特性的动力学机制,群体移动模型可以有效描述大规模人类群集移动活动现象。然而,这些模型都是针对人类地面出行活动,少有模型刻画人类航空出行活动。由于航空数据的特殊性,限制了航空出行模型的研究。
本研究基于民航旅客出行数据,提出了基于潜在出行意图的民航旅客移动模型(passenger mobility model based on potential trip purpose,PMMPTP)。模型中,由于航空旅客大部分都是低频出行旅客,因此引入了旅客潜在出行意图的概念,将旅客的出行意图化为影响出行的因素。同时,对于出行次数较多的旅客,引入并改进探索和偏好返回机制。
1 数据来源和预处理民航旅客出行记录保留在航班所属航空公司的旅客姓名记录 (passenger name record,PNR)数据集中[17],本文获取了国内一家航空公司提供的2014—2015年度的民航旅客出行数据。除去删除数据集中ID不合法的记录外,还对原始数据集进行了以下处理:
1)由于主要研究国内旅客在民航网络中的出行行为,因此去除了数据中包含的国外航线记录。此外,上海有两个机场,将其合并为一个机场进行统计;
2)临时航线的开通具有不确定性,对研究旅客出行特性具有一定的影响,在实验数据集中删除了周航班飞行次数少于1次的航线。表1为实验数据集中的基本统计信息。
由表1可知,机场网络的平均最短路径长度为2.1,簇系数为0.69,机场度服从双段幂律分布。
| 表1 实验数据集基本信息统计 Tab. 1 Basic statistics of experimental data sets |
![]() |
2 民航旅客出行特性分析
使用预处理获取的民航旅客出行数据集,分析了旅客访问不同机场数目
1)旅客出行距离分布不具有标度性。与以往的研究结果均不同,发现旅客的出行距离
2)旅客出行次数具有各向异性。将民航旅客的出行次数
|
(1) |
图1为民航旅客的出行次数分布,从图1中可以看出,旅客出行次数具有各向异性。
![]() |
| 图1 出行次数分布 Fig. 1 Distribution of travel frequency |
3)旅客扩散随出行次数不同具有不同的变化趋势。已有的人类出行特性研究中,主要使用回旋半径(radius of gyration,RG)和均方位移(mean squared displacement,MSD)随出行时间的增长规律描述人类的扩散特性[8,10]。为了分析出行次数对旅客出行特性的影响,采用旅客出行距离随出行次数的变化定义旅客的回旋半径和均方位移。民航旅客的回旋半径定义如下:
| ${r_{\rm g}}\left( n \right) = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{\left( {{x_i} - {x_l}} \right)}^2}} } $ | (2) |
式中,
| $MS \!\! D\left( n \right) = \left\langle {{{\left( {{x_n} - {x_{\rm{o}}}} \right)}^2}} \right\rangle $ | (3) |
式中,
图2和3分别为旅客回旋半径和均方位移随出行次数的变化趋势。从图2、3中可以看出,随着出行次数的不同,旅客的回旋半径和均方位移均出现了不同的变化趋势,说明出行次数对旅客扩散具有很大影响。
![]() |
| 图2 回旋半径 Fig. 2 Cyclotron radius |
![]() |
| 图3 均方位移 Fig. 3 Mean squared displacement |
民航旅客出行表现出不同于其他基础设施网络的旅客出行特性,现有的移动模型无法解释和再现民航旅客的上述出行特性,但也表明了民航旅客出行在整体上遵循可复制的模式。本文提出的移动模型不仅要解释和重现上述特性,并且要和各航线的吞吐量分布结果一致。
3 模型建模民航旅客个体在选择乘机出行时受个人意愿、文化背景、从事职业和社会关系等多重复杂因素综合影响,但大量的低频旅客的出行信息极度稀疏,无法获取和利用上述信息进行有效的出行行为建模,因此,民航旅客移动模型的研究重点在于对大量低频旅客群集移动的影响因素分析。
3.1 旅客潜在出行意图出行旅客在选择具体出行航线时具有一种或多种出行意图。本文将民航旅客在出行中持有的出行目的或动机定义为旅客的潜在出行意图。比如,选择到达商务型城市如北京、上海等航线的旅客,出行意图为商务出差的概率很大;而选择到达旅游型城市如九寨沟等航线的旅客可以很大程度上确定其出行意图为休闲旅游。类似地,也存在一次乘机出行中具有多种出行意图的情况。图4为在乘机出行记录中具有多种潜在出行意图的民航旅客的出行轨迹。大量民航旅客群体的潜在出行意图在民航网络中表现为各航线的吞吐量分布,因此,对影响航线吞吐量的因素分析可以转化为对于大量民航旅客群体的潜在出行意图分布的具体描述。
![]() |
| 图4 民航旅客潜在出行意图 Fig. 4 Air passenger potential travel purpose |
3.2 基于潜在出行意图的航线选择
影响航线旅客吞吐量主要有城市经济指标、城市旅客人数、机场度等因素[21–23]。这些因素是大量民航旅客出行航线选择因素的叠加。第3.1节给出了民航旅客潜在出行意图的概念,认为民航旅客群体出行时的航线选择主要受旅客潜在出行意图的影响,而民航旅客的多种潜在出行意图可以通过计算航线吞吐量的影响因素描述,因此,可以通过计算航线吞吐量的影响因素描述旅客对不同航线的选择概率。旅客选择机场
| ${p_{ij}} = P(1|{g_i},{g_j},{{l}_i},{{l}_j},{m_i},{n_j},{k_i},{k_j})$ | (4) |
式中:
模拟牛顿引力定律,重力模型认为单位时间内地点
| $\left\langle {{C_{ij}}} \right\rangle {\rm{ = }}\frac{{m_i^\alpha n_j^\beta }}{{f({r_{ij}})}}$ | (5) |
式中,
| $\left\langle {{C_{ij}}} \right\rangle {\rm{ = }}{C_i}\frac{{{m_i}{n_j}}}{{({m_i} + {s_{ij}})({m_i} + {n_j} + {s_{ij}})}}$ | (6) |
式中,
| $\begin{array}{l}{p_{ij}} = P(1|{g_i},{g_j},{{l}_i},{{l}_j},{m_i},{n_j},{k_i},{k_j}) = \\\;\;\;\;\;\;\;\displaystyle\sum\limits_t^{n(t)} {\frac{{G_j^t}}{{G_i^t}}} \frac{{{k_i}{k_j}}}{{({k_i} + \bar k_{ij}^n)({k_i} + {k_j} + \bar k_{ij}^n)}}\end{array}$ | (7) |
式中:
| $G_i^t = \frac{{{t_i}}}{{\displaystyle\sum\limits_{j = 1}^w {{t_j}} }}$ | (8) |
式中,
式(7)中,
| $\bar k_{ij}^n = \frac{1}{n}\sum\limits_j^n {{k_j},j \ne i} $ | (9) |
借鉴辐射模型中人口密度因素的计算方式,
根据航线的选择概率
| $\left\langle {{T_{ij}}} \right\rangle = {T_i} \cdot {p_{ij}}$ | (10) |
式中,
在建立模型时,认为旅客的出行次数为双段幂律分布的一个样本点(出行次数分布见式(1)),但是,仅以此特性无法解释旅客的其他出行模式。由第2节旅客出行特性分析可知,民航旅客的访问机场行为同样具有偏好返回特性。基于潜在出行意图的航线选择,主要考虑大量低频旅客出行因素的叠加,无法重现旅客整体的出行特性,因此本文在模型中引入了探索和返回机制,提出结合偏好返回特性的移动模型PMMPTP。图5为提出的PMMPTP模型的示意图。
![]() |
| 图5 PMMPTP模型示意图 Fig. 5 Schematic diagram of PMMPTP model |
原始的偏好返回在计算探索概率时考虑个体行程分布服从幂律分布的特性,而民航旅客的出行距离分布并不具有该特性。鉴于旅客的出行次数服从双段幂律分布,旅客探索新机场的概率计算如下:
| ${p_{{\rm{new}}}} = \frac{{{N_{{\rm{new}}}}}}{{S + {N_{{\rm{new}}}}}} = \frac{{{{(n + 1)}^\mu } - {n^\mu }}}{{S + {{(n + 1)}^\mu } - {n^\mu }}}$ | (11) |
式中:S为旅客在第n次出行时访问的不同机场数;
| ${N_{{\rm{new}}}} = p(n + 1) - p(n)$ | (12) |
显然,个体在第
| ${\pi _j} = {f_j}$ | (13) |
而基于潜在出行意图航线主要考虑大量低频旅客出行因素的叠加,故机场的历史访问频率可以用于模型中旅客探索概率的计算。
4 仿真对比与分析对PMMPTP模型进行了吞吐量、旅客出行特性两个方面的仿真测试。其中,吞吐量分为机场吞吐量和航线吞吐量。对于预处理获取的数据集,本文随机抽取了15万名旅客,其中,旅客的初始出发机场设置为出行记录中的首个出发机场,PMMPTP模型中旅客出行次数由式(1)随机生成。
4.1 吞吐量仿真分析 4.1.1 评价标准为了评价模型模拟的各机场和航线生成吞吐量与实际机场和航线吞吐量间的差距,定义吞吐量模拟的评价标准如下:
| ${D} = \sum\limits_{i = 1}^n {\frac{{T_i^{\rm{e}}}}{{T_{\rm total}}}\left| {\frac{{T_i^{\rm{p}} - T_i^{\rm{e}}}}{{T_i^{\rm{e}}}}} \right|} $ | (14) |
式中:
吞吐量体现旅客群集移动的结果,为此将本文提出的基于旅客潜在意图的航线选择算法与辐射模型、重力模型和随机游走模型进行了机场吞吐量和航线吞吐量的对比,结果如图6和7所示。
从图6、7中可以看出:相比其他模型,本文所提模型在机场吞吐量中取得了与实证数据几乎完全一致的结果;而航线吞吐量的模拟结果也与实证数据最为接近。
![]() |
| 图6 机场吞吐量 Fig. 6 Airport throughput |
![]() |
| 图7 航线吞吐量 Fig. 7 Route throughput |
表2为各模型下机场吞吐量和航线吞吐量模拟的评价指标D。从表2中可以看出:PMMPTP模型在机场吞吐量和航线吞吐量模拟中均取得了最小的
|
表2 各模型的
|
![]() |
4.2 旅客出行特性仿真分析
由于其他移动模型在建模时均未考虑旅客出行次数特性,而旅客的扩散等特性受出行次数影响,故现有模型无法重现民航旅客的出行次数标度特性和其他出行特性,因此对旅客特性模拟时仅使用了PMMPTP模型。
图8和9分别为PMMPTP模型模拟得出的旅客访问不同机场数目
由图8、9明显可以看出,PMMPTP模型的模拟结果与实证数据分布一致。其中,PMMPTP模型所得旅客访问不同机场数目的幂指数为
![]() |
| 图8 旅客访问的不同机场数对比 Fig. 8 Comparison of the number of passengers visiting different airports |
![]() |
| 图9 旅客机场访问频率对比 Fig. 9 Comparison of passenger airport access frequency |
图10和11分别为PMMPTP模型对旅客回旋半径和均方位移出行次数的变化趋势的模拟结果。从图10和11中可以看出,尽管民航旅客的回旋半径和均方位移分布随旅客出行次数的不同具有复杂的变化模式,但是PMMPTP模型的模拟结果仍然和实证结果分布表现出了基本一致的变化趋势。
![]() |
| 图10 回旋半径对比 Fig. 10 Comparison of cyclotron radius |
![]() |
| 图11 均方位移对比 Fig. 11 Comparison of mean squared displacement |
图12为PMMPTP模型对旅客出行距离分布的模拟结果。从图12中可以明显看出,PMMPTP模型的模拟结果与实证数据结果吻合。由PMMPTP模型所得的出行距离分布的拟合结果可知,当出行距离大于1 000 km时,距离分布仍然近似服从拉伸指数分布,与实证结果一致。
![]() |
| 图12 出行距离分布对比 Fig. 12 Comparison of distribution of travel distance |
图13为PMMPTP模型模拟旅客在民航网络中游走产生的机场日吞吐量序列与实证数据的对比。
从图13中可以看出:PMMPTP模型生成的旅客出行数据的机场日吞吐量序列呈现出周期性和波动性现象;该模型生成的数据与实证数据变化趋势差别较大,这表明除了受旅客出行影响外,机场日吞吐量变化还会受到其他因素影响。
![]() |
| 图13 机场吞吐量时序对比 Fig. 13 Comparison of sequence of airport throughput |
5 结 论
本文构建了移动模型描述民航旅客的出行规律。首先,以旅客姓名记录(PNR)数据为研究对象,分析了旅客出行特性,发现旅客出行距离的分布满足拉伸指数分布,出行次数分布满足双段幂律分布,旅客扩散随出行次数不同具有不同的变化趋势。为了构建适用于民航旅客出行的移动模型,本文提出了旅客潜在出行意图的概念,揭示了大量低频出行旅客的航线选择机制;同时,考虑偏好返回机制,提出了基于潜在出行意图的民航旅客移动模型(PMMPTP)。为了验证模型的合理性,进行了吞吐量、旅客出行特性两个方面的仿真测试。结果表明:在吞吐量方面,PMMPTP模型的效果优于辐射模型、重力模型和随机游走模型;在旅客出行特性方面,PMMPT模型取得了与实证数据较一致的结果。本模型并未考虑时间变化对旅客出行特性的影响,另外,需进一步研究吞吐量的影响因素,以构建更加准确的模型。
| [1] |
Brockmann D, Hufnagel L, Geisel T. The scaling laws of human travel[J]. Nature, 2006, 439(7075): 462-465. DOI:10.1038/nature04292 |
| [2] |
Gonzalez M C, Hidalgo C A, Barabasi A L. Understanding individual human mobility patterns[J]. Nature, 2008, 453(7196): 779-782. DOI:10.1038/nature06958 |
| [3] |
Song C, Qu Z, Blumm N. Limits of predictability in human mobility[J]. Science, 2010, 327(5968): 1018-1021. DOI:10.1126/science.1177170 |
| [4] |
Rhee I, Shin M, Hong S. On the levy-walk nature of human mobility[J]. IEEE/ACM Transactions on Networking (TON), 2011, 19(3): 630-643. DOI:10.1109/TNET.2011.2120618 |
| [5] |
Zhou Tao, Han Xiaopu, Yan Xiaoyong. Statistical mechanics on temporal and spatial activities of human[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(4): 481-540. [周涛, 韩筱璞, 闫小勇. 人类行为时空特性的统计力学[J]. 电子科技大学学报, 2013, 42(4): 481-540.] |
| [6] |
Montroll E W, Weiss G H. Random walks on lattices:Ⅱ[J]. Journal of Mathematical Physics, 1965, 6(2): 167-181. DOI:10.1063/1.1704269 |
| [7] |
Lee K,Hong S,Kim S J,et al.Slaw:A new mobility model for human walks[C]//Proceedings of the 28th IEEE International Conference on Computer Communication.Piscataway:IEEE,2009:855–863.
|
| [8] |
Song C, Koren T, Wang P. Modelling the scaling properties of human mobility[J]. Nature Physics, 2010, 6(10): 818-823. DOI:10.1038/nphys1760 |
| [9] |
Han X P, Wang B H. Impacts of distance and memory in the emergence of scaling mobility pattern of human[J]. Physics Procedia, 2010, 3(5): 1907-1911. DOI:10.1016/j.phpro.2010.07.035 |
| [10] |
Han X P, Wang X W, Yan X Y. Cascading walks model for human mobility patterns[J]. Plos One, 2015, 10(4): e0124800. DOI:10.1371/journal.pone.0124800 |
| [11] |
Han X P, Hao Q, Wang B H. Origin of the scaling law in human mobility:Hierarchy of traffic systems[J]. Physical Review E, 2011, 83(3): 036117. DOI:10.1103/PhysRevE.83.036117 |
| [12] |
Yang S, Yang X, Zhang C. Using social network theory for modeling human mobility[J]. IEEE Network the Magazine of Global Internetworking, 2010, 24(5): 6-13. DOI:10.1109/MNET.2010.5578912 |
| [13] |
Cho E,Myers S A,Leskovec J.Friendship and mobility:user movement in location-based social networks[C]//Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM,2011:1082–1090.
|
| [14] |
Zhao Chen, Sichitiu M L, Rhee I. N-body:A social mobility model with support for larger populations[J]. Ad Hoc Networks, 2015, 25(Part A): 185-196. |
| [15] |
Zipf G K. The P1P2/D Hypothesis:On the intercity movement of persons[J]. American Sociological Review, 1946, 11(6): 677-686. DOI:10.2307/2087063 |
| [16] |
Simini F, González M C, Maritan A. A universal model for mobility and migration patterns[J]. Nature, 2012, 484(7392): 96-100. DOI:10.1038/nature10856 |
| [17] |
Lawrence R D,Hong S J,Cherrier J.Passenger-based predictive modeling of airline no-show rates[C]//Proceedings of the ninth ACM SIGKDD International Conference on Knowledge Discovery and Data.New York:ACM,2003:397–406.
|
| [18] |
Clauset A, Shalizi C R, Newman M E J. Power-law distributions in empirical data[J]. SIAM Review, 2009, 51(4): 661-703. DOI:10.1137/070710111 |
| [19] |
Alstott J, Bullmore E, Plenz D. Powerlaw:A Python package for analysis of heavy-tailed distributions[J]. Plos One, 2014, 9(1): e85777. DOI:10.1371/journal.pone.0085777 |
| [20] |
Huang Feihu, Peng Jian, You Mingyang. Analyses of characetristics of air passenger group mobility behaviors[J]. Acta Physica Sinica, 2016, 65(22): 228901. [黄飞虎, 彭舰, 由明阳. 航空旅客群体移动行为特性分析[J]. 物理学报, 2016, 65(22): 228901. DOI:10.7498/aps.65.228901] |
| [21] |
Zhang Zhidong, Xu Jianhong. An analysis of major factors on airport passenger volumes[J]. Urban Transport of China, 2007, 5(6): 54-57. [张子栋, 徐建红. 机场旅客吞吐量主要影响因素[J]. 城市交通, 2007, 5(6): 54-57.] |
| [22] |
Zhang Yaping, Peng Ting, Fu Chuanyun. Simulation analysis of factors affecting air route connection in China[J]. Journal of Air Transport Management, 2016, 50: 12-20. DOI:10.1016/j.jairtraman.2015.09.002 |
| [23] |
Tsui W H K, Balli H O, Gilbey A. Forecasting of Hong Kong airport’s passenger throughput[J]. Tourism Management, 2014, 42(42): 62-76. |
2017, Vol. 49















