杂志的下一篇文章
一种基于混合NoSQL的减灾可视化多层图像分块按需检索方法
期刊上的上一篇文章
利用多卫星全球导航卫星系统(GNSS)观测进行运动精确点定位
 
 
订购文章重印
字体类型:
宋体 佐治亚州 宋体,Verdana
字体大小:
澳大利亚 澳大利亚 澳大利亚
行距:
列宽:
背景:
第条

理解手机位置数据在表征人类移动指标中的代表性

1
武汉大学测绘与遥感信息工程国家重点实验室,地址:中国武汉市珞瑜路129号,邮编:430079
2
中国武汉市珞珈路129号地理空间技术协同创新中心,邮编:430079
中国深圳市红里西路8007号深圳市城市规划、土地和房地产信息中心,邮编:518040
4
田纳西大学地理系,美国田纳西州诺克斯维尔37996
5
中国科学院深圳高新技术研究院,中国深圳市学院路1068号,邮编:518005
*
信件应寄给的作者。
ISPRS国际地理信息杂志。 2017,6(1), 7;https://doi.org/10.3390/ijgi6010007
收到的提交文件:2016年11月8日/修订日期:2016年12月18日/接受日期:2017年1月2日/发布日期:2017年1月6日

摘要

:
大数据的出现有助于理解人类流动的驱动力,这对许多领域都是有益的,例如流动预测、城市规划和交通管理。然而,许多研究中使用的数据源,例如手机位置和地理标记的社交媒体数据,在时间尺度上都是稀疏采样的。个人记录可以在一天、一周或一个月的几个小时内分发。因此,稀疏手机位置数据在表征人类流动性方面的代表性需要在使用数据推导人类流动模式之前进行分析。本文通过使用中国深圳一家主要运营商收集的用户手机位置数据来研究这一重要问题。使用一个每天24小时覆盖500多万手机用户的数据集作为基准,测试手机位置数据在人类活动指标上的代表性,如总行程距离、运动熵和回转半径。本研究按小时划分数据集,使用2到23小时的数据段来评估手机位置数据可用性的代表性。结果表明,不同数量的小时分段会影响对人类流动性指标的估计,并可能导致从个人角度的高估或低估。平均而言,总行程和运动熵往往被低估。估计总行程的低估系数结果近似线性,随着时间段数的增加而下降,估计运动熵的低估系数随着时间段的增加而对数下降,然而,由于孤立位置的丢失,回转半径往往更加模糊。本文建议,在大数据时代,研究人员应该仔细解释这种稀疏数据的结果。

1.简介

了解人类的流动性至关重要[1,2],在各个领域(如流动性预测)都有潜在的好处[,4],城市规划[5,6,7],运输研究[8,9]和人类健康研究[10]. 随着信息和通信技术的飞速发展[11]在过去二十年中,人类产生的各种类型的大规模数字足迹,如智能卡数据、通话详细记录(CDR)、地理标签社交媒体数据、GPS跟踪数据、WiFi数据、信用卡记录数据及其伴随分析,都被用于人类移动性研究[2,12,13,14,15,16,17,18]. 然而,对于数据的代表性或固有偏见存在争议。例如,以前的研究表明,手机用户在年龄、性别和地理位置上分布不均[19,20]. 社交媒体数据中也存在这种偏见[21,22].
与GPS跟踪数据不同,GPS跟踪数据每分钟可以有多条记录[23],之前研究中使用的数据(如手机位置和社交媒体登记数据)的一个主要缺点是“稀疏地'在时间尺度上采样。因此,由于人们的电话活动在空间和时间上分布不均,个人的记录可以在一天、一周或一个月的几个小时内分发,这是一个需要注意数据的问题[24]. 先前的研究人员已经讨论了CDR如何在人类移动性研究中引入偏见[25,26]偏差水平如何与个人轨迹中采样的电话通信记录的比率密切相关[26]. 此外,Sagarra等人[27]提出了一种超抽样模型来评估简化数据的抽样偏差。由于缺乏轨道的基本事实,不同时间段的代表性尚未得到全面调查。稀疏手机位置数据对人类流动性估计的代表性是什么?在使用数据研究人类流动模式并得出结果之前,必须解决这个问题。
在本文中,我们定量分析了移动电话位置数据对个人移动模式估计的代表性。CDR通常在电话通信过程中捕获个人足迹,而主动跟踪的手机位置数据包含电话通信记录和位置更新触发的位置记录策略例如定期和定期更新以及蜂窝切换。本研究使用主动跟踪数据进行调查。图1显示了一个人在一整天内从手机位置数据集中的完整轨迹。Voronoi细分用于表示手机塔的服务区域。很难确定真正的路径,因为即使在主动更新策略下,大多数手机塔也没有被记录。因此,本研究的主要研究问题是确定稀疏时间采样的手机位置数据对人类移动指标评估的影响。
本文对这一问题进行了研究,并提出了一些建议,以选择合适的数据集来分析人类流动性。这项研究的结果也可以用于评估其他类型稀疏抽样数据的代表性,例如地理标签社交媒体数据。
本文的组织结构如下:在第二部分中,我们对与本研究相关的研究进行了回顾。第3节介绍了主动跟踪手机位置数据集和研究领域。第4节描述了评估用于测量人类流动性指标的稀疏手机数据的代表性的方法。第5节讨论了分析结果。最后一部分总结了我们的发现并讨论了未来的研究方向。

2.文献综述

本节介绍了以下两个领域的相关研究;大数据对人类流动性的研究以及大数据的代表性问题。

2.1、。用于人类活动研究的手机位置数据

近年来,随着大数据的出现,人们报告了许多与人类流动性和与城市环境的互动有关的有价值的发现。这些深入的研究可以用于流动性预测[,4]、城市规划[5,6,7],运输研究[8,9,28]、和其他字段[10,29]. 在这些数据集中,手机位置数据是非常特殊的数据,因为手机的渗透率极高,人们通常随身携带手机,尤其是在中国等亚洲国家。一些研究人员认为这类数据是描述人类活动性的合理来源[30].
通过使用稀疏采样的手机位置数据,Kung等人[31]研究了不同国家几个城市的家庭工作通勤模式,发现通勤时间和平均值分布与通勤距离或国家无关。Diao等人[32]通过提出一个基于旅行日志调查的活动检测模型,发现了管理个人活动参与的一般规律,并提取了嵌入的信息。人类足迹也可用于分析城市地区收敛和发散的时空模式[33]. 对于交通研究,可以使用手机位置数据得出的出行链段来估计公共交通规划中自行车出行的动态潜在需求[34]. 通过估计动态始发地矩阵,描述了工作日和周末的出行模式,以分析随时间变化的出行需求差异[35]. 然而,子样本数据集在提供流动模式的良好估计方面有多好?这个问题的答案不仅仅是“是”或“否”,但对稀疏采样位置数据的代表性进行调查可能有助于找到一些答案。
此外,人类活动空间和该空间中的流动异质性也是许多关于人类流动性研究的主题[2,36,37,38,39]. 例如,González等人[2]发现所有个体的回转半径都可以用截断幂律近似。Yuan等人[37]探讨了手机使用与以运动熵和半径为特征的出行行为指标之间的关系。稀疏手机记录中缺少一些外围位置点可能会影响实际场景中移动半径的计算。卡拉布雷斯等人[30]比较手机和车辆数据之间的总行程长度,并证明使用手机发射塔之间的欧几里德距离来测量个人机动性可能会带来一些向下的偏差,但位置记录的稀疏分布是否也是造成这种偏差的原因之一还需要验证。Song和Barabási[39]和加洛蒂[40]使用熵预测个人流动模式。此外,Cuttone等人[41]发现手机数据的空间分辨率和时间分辨率与预测人类流动性的准确性之间也存在一些关系。稀疏位置数据在表征个体人类活动性方面的有效性应得到更多关注。
此外,从上面回顾的文献来看,许多指标被用来表征人类的流动模式,例如回转半径[2,38],运动熵[37,39,40],和行驶距离[26,30]. 这些指标通常用于表征出行距离、活动空间范围和访问模式的异质性,这是人类流动性的三个基本指标。然而,很少有研究报告稀疏的位置数据在描述个人流动性方面的代表性。

2.2. 大数据的代表性问题

尽管对大数据进行了热切的研究,但也存在关于隐私的争论[42,43,44],数据质量[45,46,47,48]和代表性问题[25,26]. 先前的研究表明,手机用户在性别和地理位置上的分布不均衡[19,20]和人口构成[49]. 社交媒体数据中也存在这种偏见[21,22]. 还研究了空间采样和稀疏位置数据粒度的影响[24,50].
时间采样问题在使用数据调查人类流动模式时至关重要。从时间和空间角度来看,GPS跟踪数据可以具有相对精细的粒度[23,51]; 然而,由于人们的电话活动在空间和时间上的不均匀分布,以往研究中使用的手机位置数据和带有地理标签的社交媒体数据在时间上采样非常稀疏,这是需要注意的主要问题[24]. 个人的手机记录或社交媒体登记数据可以在一天、一周或一个月的几个小时内分发。好孩子[52]指出质量控制的损失和严格的抽样是大数据的特点,可以将其与小数据区分开来。尽管先前的研究表明,稀疏采样的CDR给人类活动性研究带来了一些偏差[25,26]偏差水平与个人完整轨迹中CDR的比率密切相关[26],它们没有描述如果无法比较完整的轨迹,如何获得更具代表性的数据集。
时间或空间采样位置数据的不完整性也是导致不确定性问题的一个重要因素地理信息科学[53,54],引发了对不确定性如何影响调查结果的担忧[55,56]. 一些研究人员认为,长时间有助于增加样本量;雅各布斯[57]注意到这些数据是随时间和/或空间变化的大量重复观测,可能无法消除稀疏问题。关键问题是“手机位置数据在提供个人流动性指标的准确估计方面有多好?”在使用数据调查人类流动模式并得出合理结果之前,还有待解决。
因此,本文定量评估了稀疏手机位置数据在个人流动性指标估计中的代表性。我们不仅关注于确定不同时间段对人类活动特征的影响,还关注于提供数据代表性的清晰定量认知。

3.研究区域和数据集

本研究的研究区域是中国最大的城市之一深圳。本节提供深圳的背景信息以及在深圳收集的主动跟踪手机位置数据集。

3.1. 研究区域

深圳人口超过1500万,面积约2000平方公里,是中国城市中人口密度最高的城市。其年国内生产总值(GDP)在中国所有城市中排名第四[58],仅次于上海、北京和广州。深圳位于中国南海岸,与香港隔海相望(图2). 深圳已经发展成为一个有影响力的国际城市。深圳繁荣的社会经济地位使其成为人口流动和商业区分析的良好选择。

3.2. 数据

我们研究中使用的手机位置数据是由一家非常大的手机公司收集的,该公司约占深圳整个手机市场的60%。在一个工作日内收集了大约1600万用户的位置记录。表1显示了移动电话位置数据的属性。出于隐私考虑,用户ID是加密的。每次用户使用手机时,移动通信运营商都会记录最近的手机塔。与通话细节记录数据不同,本文中的手机位置数据记录包含以下连接类型:
(1)
拨打和接听电话;
(2)
发送和接收短信;
(3)
定期更新位置(由从一个移动电话塔移动到另一个移动手机塔触发),以及
(4)
定期位置更新(如果用户在指定的时间段内没有电话活动,则由塔ping触发)。
(3)和(4)是此数据集的两种主动更新策略。此数据集中未提供连接类型。即使在主动更新策略下,我们也无法确定实际路径,因为大多数手机塔都没有被记录(图1)。
这个数据集中有5940个独特的手机塔。图3显示了手机塔的空间内核密度。手机塔在城市空间中分布不均。总的来说,手机塔密集分布在市中心和人口稠密地区,而手机塔稀疏分布在郊区,导致定位精度较低。相邻手机塔之间的平均距离约为0.21公里,最大距离约为2.6公里。
由于本文的重点是研究备用手机位置数据在表征人类流动模式方面的代表性,因此人们的手机活动在空间和时间上的不均匀分布是我们研究目标的主要关注点[24]而城市地区手机塔的密集分布表明,手机塔级别的空间粒度可能不是本研究区域的主要缺陷。

4.方法

本文介绍了常用的人体活动指标。此后,评估手机位置数据代表性的方法包括三个主要步骤。首先,我们将一天划分为24小时时段,将其记录涵盖所有24小时时段的订户提取到一个新的数据集中,并计算其完整的人类流动指标作为本研究的基准。然后,我们根据随机规则从新数据集中选择不同数量的时间段来计算采样的人类流动性指标。最后,提出了一个线性回归模型,以量化每个随机时间内采样和完整人类活动指标之间的总低估水平。

4.1. 常用的人力流动指标

测量活动空间的常用指标有很多,如最大行程距离、回转半径、运动半径、总行程距离、运动熵、访问频率等。这些指标主要可以分为三类,即活动空间的范围、行程距离、,以及活动空间内访问模式的异质性。例如,运动熵和访问频率都被用来表征访问模式的异质性。因此,本文使用了其中三个来描述人类活动行为。根据工作日计算,定义如下:
总行驶距离:总行驶距离是每对连续记录之间的欧几里得距离之和[26],这是个人流动性的基本衡量标准。
运动熵:访问模式异质性特征[37,38],计算为
S公司 = = 1 n个 第页 日志 2 第页
哪里n个是用户访问的不同手机塔的数量,以及第页是该位置的概率已访问。
回转半径:描述订户旅行的范围;描述活动空间范围最常用的度量之一[2,38],计算为
R(右) = 1 N个 j个 = 1 N个 | 第页 j个 第页 c(c) | 2
哪里N个是用户访问的按时间顺序排列的手机塔数,第页j个第j个用户访问的塔,以及第页厘米是所有时序位置的中心。

4.2。提取有效订阅服务器

在介绍了常用的人类流动性指标后,用于评估手机位置数据在表征这些指标时的代表性的方法包括三个主要步骤,如下所述。
首先,我们提取了记录足以进行本研究的订户。我们把一天分成24个一小时的时间段;00:00:00到00:59:59(#0),01:00:00至01:59:58(#1),……,23:00:00 to 23:59:55(#23)。本文使用时间段数从时间角度描述稀疏采样记录项。然后,我们提取了记录覆盖所有24个时间段的订户。
显然,不同用户的手机位置记录稀疏地分布在不同数量的时间段中。订阅者的记录所处的时间段越短,从时间角度来看,记录越稀疏。例如,约3.37%的用户记录每天只在一个小时内,拥有24个时间段记录的用户百分比为35.70%,这意味着近65%的用户记录分布在不到24个时间段里,如图4此外,约13.18%的用户记录在6个或更少的部分。因此,在不覆盖足够的时间间隔的情况下,能否正确描述用户的移动模式是值得怀疑的。
这项研究包括580万用户的数据,因此可以用来研究不同时间段对表征人类流动模式的影响。也许这些用户习惯于比其他用户更频繁地使用手机。此外,先前的研究表明,手机用户在年龄、性别和空间上分布不均[19,20]. 因此,我们的子样本数据集中的手机用户在这些方面可能有不同的偏见,这需要在未来的工作中进一步探讨。

4.3. 随机规则

提取580万订户后,我们将每个订户的记录分为24个时间段,如所示图5.
为了研究稀疏手机位置数据在估计个人流动性指标方面的代表性,本研究将时间段的数量从2到23个不等。对于每个时间段的数量,将选择随机100次,以确保可以选择每个时间段。例如,当选定的时间段数量为两个时,可以选择时间段(#2、#5)或段(#3、#9);当选定的时间段数量为三个时,可以选择段(4、5、21)或段(2、6、17),如所示图6此外,即使时间段的数量相同,选定的时间段也不会重复。例如,当选定的时间段数量为三个时,段组合(#4、#9、#22)仅在所有100个随机时间中选择一次。
此外,对于相同数量的时间段,每个时间段应在每100次中至少选择5次。例如,在选择两个时间段时,如果选择了段(#2、#5)、(#2和#7)、(#2、#16)、(#12、#19)和(#2,#23),则#2出现五次,但#5、#7、#16、#19、#23只出现一次,其他18个段没有出现。因此,在接下来的95个随机时间内,将更多地关注随机选择中的其他23个片段。该规则旨在减少选择每个时间段时的不平等。
当有23个时间段时,只有24个选项可供选择。580万用户的随机抽样流动指标中的每一项都是通过使用每个随机时间段内选定时间段内的所有移动电话记录来计算的。

4.4。评估总低估系数

对于每个随机时间,我们使用580万用户随机选择的时间段中的采样记录,计算了一组采样指标值、采样总行程距离、采样运动熵和采样回转半径。
为了量化抽样时间段在表征人类流动性指标时的总低估水平,使用了线性回归模型[26].
= x个 + b条
这里,对于每个随机时间,通过使用整个时间段中的完整记录计算的每个移动性指标被定义为自变量x个,相应的采样流动性指示器被定义为因变量通过使用随机选择的时间段中的记录。系数衡量580万用户的抽样指标与完整指标之间的关系。在这里,b条在线性回归模型中设置为0,因为当完整基准数据集中的流动性指标为0时,所选数据集中的移动性指标也应为0。系数通过最小二乘回归法进行校准[60].
因此,总低估系数(加州大学)定义如下:
u个 c(c) = 1
显然,较低的加州大学也就是说,低估水平越低,随机选择的时间段用于表征人类流动性指标的代表性就越高。例如,当所选时间段为(#3、#6、#7、#13、#19和#21),且采样总行程距离与完整总行程距离之间的系数为0.25时,聚合低估系数为0.75。这个加州大学相对较高,这意味着这六个时间段的代表性较低,因为使用这六个时段的记录计算的总旅行距离可能比研究区域内它们的总足迹短75%左右。

5.结果

5.1. 通过随机选择时间段测量流动性指标

本节从个人角度分析了抽样流动性指标和完整流动性指标之间的各种差异。然后从平均值的角度探讨了定量聚集低估效应。

5.1.1. 个人视角

本节重点评估个人日常流动模式分析中稀疏手机位置数据的代表性。随机流动性指标和完整流动性指标的示例如所示表2图7,图8图9.
水平轴和垂直轴分别表示完整时间段和随机时间段的流动性指标。如果随机时间段代表完整的时间段图7,图8图9应该靠近从左下到右上的浅蓝色对角线。如灰点所示,不同时间段对个人流动性指标估计的代表性差异很大。例如,当使用10个时间段时,32.79%的用户高估了个人运动熵,19.42%的用户则高估了个体回转半径。
由于三角形原理,较少的记录导致较短的总行程,因此不能过高估计随机总行程。然而,由于计算中使用了不同时间段的记录,不同个体的运动熵和回转半径可能被高估或低估。平均水平通常用于表征相应带宽的分布[4,26,37,38]. 评估的平均水平如下所述。

5.1.2. 平均视角

图7,图8图9,红色圆点和蓝色对角线之间存在偏差,这表明使用较少的手机位置数据时间段往往会从平均角度低估总行程距离、运动熵和回转半径,这也可以从中看出表2.
从平均角度来看,总行程的低估系数为0.86(R(右)2=0.291,拟合优度[61])当有3个时间段时。当使用10个时间段时,低估系数为0.52(R(右)2= 0.894). 采样的总行驶距离通常不会被高估,因为记录越少,总行驶距离越短。随着时间段数量的增加,总行程距离与蓝色对角线的偏差较小。相反,当整个总行驶距离增加时,平均总行驶距离的变化也会增加。例如,当10个时间段的完整总行驶距离为100 km时,随机行驶距离约为65 km,但当完整总行驶里程为200 km时,则随机总行驶距离介于70 km和140 km之间。这可能是因为用户数量随着总旅行距离的增加而迅速减少,并且因为某些时间段中的位置记录与其他时间段中的位置记录相距甚远。
总行程可能超过70公里,这是由出租车或公交车司机、包裹递送者和游客等订户造成的。这些用户占580万用户的不到2.0%。另一个有趣的模式是,当使用23个时间段时,平均总旅行距离的范围应该更窄。这主要是因为随机时间较少,所选记录与每个人的总记录非常接近。
由于使用不同时间段的记录进行计算,不同个体的运动熵可能被高估或低估。然而,从平均角度来看,运动熵估计中低估系数的下降趋势可以从图7,图8图9当使用3个时间段时,运动熵的低估系数为0.49(R(右)2=0.943),但当使用10个时间段时,低估系数为0.18(R(右)2=0.986),非常接近于0。此外,当使用23个时间段时,这些点接近蓝色对角线,低估系数仅为0.01,这意味着这23个时间段里的记录可以完全代表完整的运动熵。
与总行程和运动熵不同,随机平均回转半径的分布并不总是随完整回转半径的增加而增加。如所示图7,图8图9,随机平均回转半径增加,直到完全回转半径约为9km。然后,尽管完全回转半径增加了,但平均随机回转半径下降。因此,在9km范围内使用线性回归模型。为了估计回转半径,在大多数情况下,不完整的手机位置记录可能足以分析正常日常活动范围内(即小于9km)的用户出行。
此外,对于完全回转半径大于9公里的用户,由于一些长途位置的丢失,平均随机回转半径通常为零或非常接近零。这些订阅者占所有有效订阅者的比例不到7.0%,通常会前往许多不同的方向,而且可能旅行范围很广。因此,上午8点到下午8点之间缺少任何时间段可能会显著影响回转半径。这些订阅者的社会身份可能是出租车或优步/滴滴司机、包裹递送者或游客。因此,手机位置数据可能会大大低估活动范围非常广(即大于9公里)的用户的回转半径。此外,当完全回转半径增加时,随机回转半径的范围应该更宽。
最重要的是,即使使用多个时间段,也会产生更小的回转半径,这表明不完整的轨迹对于推导日常活动空间的范围仍有疑问。
使用来自不同时间段的手机位置记录可以在总行程距离、运动熵和回转半径的分布中产生非常不同的结果,这些结果分别表示了个人流动模式的距离、范围和异质性。因此,在使用手机位置数据回答不同的研究问题之前,应该解决手机位置数据的代表性问题。接下来,我们从平均角度使用低估系数对不同数量的时间段和具有不同时隙的相同数量时间段的代表性进行了全面比较。

5.2. 总行程低估系数的定量分析

为了评估不同数量的时间段和具有不同时隙的相同数量时间段的代表性,我们将选定的时间段数量从2个变为23个。对于每个时间段的数量,我们将选择随机100次,但使用23个时间段的情况除外。对于每个随机时间,我们可以计算总行程低估系数。估计总行程的低估系数分布如所示图10.
首先,很明显,即使时间段的数量相同,低估系数也会有很大不同。例如,当使用4个时间段时,低估系数在0.77到0.90之间变化,而当使用18个时间段,低估系数则在0.19到0.26之间。这些模式表明,不同时间段的位置记录在表征人类活动性研究中的总旅行距离方面具有不同的代表性。这在人类活动的背景下相对容易理解:如果选定的时间段主要与家庭活动有关,那么总旅行距离往往较短,低估系数往往较高,但如果选定的时段涵盖家庭和工作活动,总行程趋于较大,导致低估系数较低。
其次,另一个有趣的模式是,随着选定时间段的数量增加,低估系数往往会显著下降。使用2个时间段时,平均低估系数为0.93,使用23个时间段后,平均低估值降至0.04。通过用截距拟合另一个线性回归模型,下降趋势几乎是线性的(R(右)2=0.99)和n个表示时间段的数量。
u个 c(c) ¯ d日 ( n个 ) = 0.04 n个 + 0.92
使用此模型,很容易确定移动电话位置数据在估计总行程中的代表性。例如,如果每个人的记录只涵盖八个时间段,那么总行程距离可能比他们在研究区域的总足迹短大约60%。

5.3. 运动熵低估系数的定量分析

类似地,我们可以计算每个随机时间的运动熵低估系数。用于估计运动熵的聚合低估系数的分布如所示图11.
正如估计总行程的低估系数分布一样,很明显,即使时间段数量相同,低估系数也可能会有很大不同。例如,当使用7个时间段时,低估系数在0.24到0.39之间变化。这种模式很容易理解,因为可能会有新的地点,或者某些地点的访问频率可能会在不同的时间段发生变化。此外,随着时间段数量的增加,低估系数的范围可能会缩小。例如,当使用4个时间段时,低估系数在0.39到0.68之间变化,而当使用18个时间段,低估系数则在0.02到0.10之间。当所选时间段的数量在2到10之间变化时,平均低估系数从0.64显著下降到0.20。
另一个有趣的模式是,随着选定时间段的数量增加,低估系数趋于下降。趋势可以用带截距的对数回归模型拟合(R(右)2= 0.99,n个是时间段的数量)。
u个 c(c) ¯ ( n个 ) = 0.20 自然对数 ( n个 ) + 0.64
我们可以很容易地确定移动电话位置数据的代表性,以便使用该模型估计移动熵。例如,如果每个人的记录仅涵盖八个时间段,则低估系数约为0.25,因此平均运动熵可能比他们在研究区域的总足迹小约25%。

5.4条。回转半径低估系数的定量分析

同样,我们可以计算每个随机时间的回转半径低估系数。估计回转半径的总低估系数分布如所示图12.
如中所述第5.1.2节,为了估计回转半径,在大多数情况下,不完整的手机位置记录可能足以分析用户在正常的日常活动范围内旅行,例如小于9公里。因此,在本节中,我们主要关注小于9公里的回转半径。
显然,即使时间段的数量相同,低估系数也可能会有很大不同。例如,当使用4个时间段时,低估系数在0.31到0.97之间变化。这种模式很容易理解,因为不同的时间段可能会有新的位置。此外,随着时间段数量的增加,低估系数的范围可能会缩小。例如,当使用3个时间段时,低估系数在0.36到0.77之间变化,当使用的时间段超过15个时,低估值在0.28到0.35之间。
下降趋势可以用带截距的线性回归模型拟合(R(右)2= 0.63,n个是时间段的数量),我们可以使用此模型轻松确定移动电话位置数据对于估计9 km内的回转半径的代表性。与总行程和运动熵不同,拟合优度(R(右)2)只有0.63。
u个 c(c) ¯ 第页 ( n个 ) = 0.009 n个 + 0.44
选择的时间段越少,回转半径越不确定。从中可以看出图12,即使使用23个时间段,平均低估系数也大于0.29,这意味着任何数量的采样时间段都可以将研究区域的每日出行范围描述为至少比其总足迹短29%。此外,正如在第5.1.2节对于活动范围大于9km的用户,由于缺少外围位置点,采样的回转半径通常会低得多。这也表明,回转半径可能不是通过使用稀疏采样的位置数据(例如手机位置数据)来表征人类活动范围的最合适的测量方法。因此,我们建议研究人员谨慎使用指标来解释从稀疏采样的位置数据中得出的结果。
最后,根据用户的结果和分布图4,如果给一个移动追踪个人的真实样本,并假设加州大学当24个时间段为0时,该研究区域的总行程、运动熵和回转半径的加权低估水平分别约为23%、11%和21%。

6.结论

本文研究了稀疏手机位置数据在表征流动性指标方面的代表性,这些指标用于测量活动空间的范围、旅行距离和活动空间内访问模式的异质性。本研究的贡献有三方面:
首先,案例研究表明,每个人的流动性指标估计值的代表性可能导致高估或低估。然而,从普通人的角度来看[4,26,37,38]与所有记录相比,不完整的手机位置数据往往低估了移动指标,例如平均总行程距离和移动熵。此外,对平均回转半径的低估变得更加显著。手机数据的代表性还取决于不同时间段的记录。
其次,本研究定量评估了从基准数据集中随机选择的时间段在表征人类流动性指标方面的代表性。随着时间段数量的增加,用于估计总行程的总低估系数线性下降。例如,如果每个人的记录只覆盖了33%的轨迹,那么总行程距离可能平均比他们在研究区域的总足迹短60%左右。随着时间段数量的增加,用于估计运动熵的总低估系数呈对数下降。例如,如果每个人的记录只覆盖了轨迹的33%,则总低估系数约为0.25,因此运动熵可能比他们在研究区域的总足迹平均少约25%。
最后,对于回转半径,低估效应可能非常显著,即使使用23个时间段,平均低估系数也大于0.29,这意味着不完整的手机位置数据可以描述出平均每天的出行量,大约比他们在研究区域的总足迹少29%。这可能表明,应谨慎使用回转半径,因为使用稀疏采样的位置数据(例如手机位置数据)很容易低估回转半径。然而,由于不同的城市环境和手机使用习惯,我们的研究结果可能适用于或不适用于其他城市。
本研究提供了一种评估手机位置数据在人类移动性研究中代表性的替代方法。本文提出的方法也可用于地理标签社交媒体登记数据等粗糙数据。使用这里的调查方法,研究人员可以了解他们数据的优势和局限性,以帮助得出合理的结果。然而,我们确实注意到一些特定于稀疏采样位置数据的限制和挑战,例如:
(1)
手机使用习惯;图4结果表明,用户记录的时间覆盖率大多相对较低,这可能与用户的手机使用习惯有关。因此,如果用户经常旅行但很少携带手机,那么在非随机抽样的手机位置数据中,低估系数可能会更高。
(2)
使用子样本而不是整个数据集的偏差;子样本数据集中的手机用户在性别、年龄或地理位置上可能有不同的偏见[19,20]. 在未来的研究中,我们将进一步探讨这种偏见对描述人类流动模式的影响。

致谢

作者感谢匿名评论员的宝贵评论。本研究得到了国家自然科学基金(41231171、41371420、41371377和41301511)、武汉大学创新研究基金(2042015KF0167)、田纳西大学文理卓越教授和Alvin和Sally Beaman教授的联合支持,广东省国际科技合作项目(2014A050503053)。

作者贡献

本研究主要由卢世伟和方志祥共同制定和设计。Ling Yin提供了数据集。陆世伟、张喜瑞、赵志远和杨西平进行了实验并分析了数据。陆世伟、方志祥和肖石龙撰写了手稿。方志祥、肖石龙和尹凌审阅了手稿并发表了评论。

利益冲突

作者声明没有利益冲突。

工具书类

  1. 布罗克曼,D。;赫夫纳格尔,L。;Geisel,T。人类旅行的比例定律。自然 2006,439, 462–465. [谷歌学者] [交叉参考] [公共医学]
  2. González,医学博士。;伊达尔戈,C.A。;Barabási,A.L.了解个人的流动模式。自然 2008,453, 779–782. [谷歌学者] [交叉参考] [公共医学]
  3. 努拉斯,A。;Scellato,S。;兰比奥特,R。;庞蒂尔,M。;许多城市的故事:人类城市流动的普遍模式。公共科学图书馆 2011. [谷歌学者] [交叉参考]
  4. 西米尼,F。;González,医学博士。;Maritan,A。;Barabási,A.L.流动和迁移模式的通用模型。自然 2012,484, 96–100. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  5. 拉蒂,C。;法国人,D。;Pulselli,R.M。;Williams,S.Mobile landscapes:使用手机的位置数据进行城市分析。环境。计划。B计划。设计。 2006,33, 727–748. [谷歌学者] [交叉参考]
  6. 高,S。;刘,Y。;Wang,Y。;Ma,X.从手机数据中发现空间交互社区。事务处理。地理信息系统 2013,17, 463–481. [谷歌学者] [交叉参考]
  7. Pei,T。;Sobolevsky,S。;拉蒂,C。;Shaw,S.L。;Li,T.等人。;Zhou,C.基于聚合手机数据的土地利用分类新见解。国际地质杂志。信息科学。 2014,28, 1988–2007. [谷歌学者] [交叉参考]
  8. 北卡罗来纳州卡塞雷斯。;罗梅罗,L.M。;F.G.贝尼特斯。;Del Castillo,J.M.使用手机数据的交通流量估算模型。IEEE传输。智力。运输。系统。 2012,13, 1430–1441. [谷歌学者] [交叉参考]
  9. 高,H。;Liu,F.根据手机位置数据估算高速公路交通量。欧洲药典。物件。 2013,229, 252–260. [谷歌学者] [交叉参考]
  10. 杜威,B。;Neutens,T。;Lefebvre,W。;Seynaeve,G。;Vanpucke,C。;贝克斯,C。;N.V.Weghe,使用手机数据对空气污染暴露进行动态评估。国际健康地理杂志。 2016,15, 1–14. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  11. 卢·T。;郭,X。;徐,B。;赵,L。;彭,Y。;Yang,H.大数据中的下一件大事:ICT供应链的安全。国际协调社会计算。 2013,10, 1066–1073. [谷歌学者]
  12. Järv,O。;阿哈斯·R。;Witlox,F.了解人类活动空间的月度变化:一项使用手机通话详细记录的12个月研究。事务处理。决议第C部分:应急技术。 2014,38, 122–135. [谷歌学者] [交叉参考]
  13. 刘,Y。;隋,Z。;康,C。;Gao,Y.从社交媒体登记数据中揭示城市间旅行和空间互动的模式。公共科学图书馆 2014. [谷歌学者] [交叉参考][公共医学]
  14. 钟,C。;巴蒂,M。;曼利,E。;Wang,J。;王,Z。;陈,F。;Schmitt,G.规律的可变性:使用智能卡数据挖掘伦敦、新加坡和北京的时间流动模式。公共科学图书馆 2016. [谷歌学者] [交叉参考] [公共医学]
  15. Lenormand,M。;路易斯·T。;坎图罗斯,O.G。;Picornell,M。;Herranz,R。;阿里亚斯,J.M。;Barthelemy,M。;米格尔,M.S。;Ramasco,J.J.勘误:社会人口特征对人类流动性的影响。科学。代表。 2014. [谷歌学者] [交叉参考] [公共医学]
  16. 郑毅。;李强。;陈,Y。;谢,X。;Ma,W.Y.根据GPS数据了解机动性。《第十届泛在计算国际会议论文集》,韩国首尔,2008年9月21日至24日。
  17. 加洛蒂,R。;巴扎尼,A。;兰巴迪,S。;Barthelemy,M.,一个随机加速步行者的随机模型,用于人类活动。国家公社。 2016. [谷歌学者] [交叉参考] [公共医学]
  18. 风,D.K。;Sapiezynski,P。;Furman,文学硕士。;Lehmann,S.从WiFi推断停止位置。公共科学图书馆 2016. [谷歌学者] [交叉参考] [公共医学][绿色版本]
  19. 韦索洛夫斯基,A。;Eagle,N。;上午Noor。;斯诺,R.W。;Buckee,C.O.肯尼亚的异构手机所有权和使用模式。公共科学图书馆 2011. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  20. 韦索洛夫斯基,A。;Eagle,N。;中午,上午。;斯诺,R.W。;Buckee,C.O.手机所有权偏见对人类流动性估计的影响。J.R.Soc.接口2013. [交叉参考] [公共医学]
  21. Mislove,A。;莱曼,S。;Ahn,Y.Y。;Onnela,J.P。;罗森奎斯特,J.N.了解推特用户的人口统计学。2011年7月17日至21日,西班牙巴塞罗那,第五届AAAI网络日志和社交媒体国际会议记录。
  22. Hecht,B。;斯蒂芬斯,M.《城市故事:志愿地理信息中的城市偏见》。2014年6月2日至4日,美国密歇根州安娜堡,第八届AAAI网络日志和社交媒体国际会议论文集。
  23. 方,Z。;Shaw,S.L。;涂,W。;李强。;Li,Y.基于时间地理概念的关键交通环节时空分析:中国武汉关键桥梁案例研究。J.事务。地理。 2012,23, 44–59. [谷歌学者] [交叉参考]
  24. 贝克尔,R。;Cáceres,R。;Hanson,K。;Isaacman,S。;Ji,M.L。;Martonosi,M。;罗兰,J。;Urbanek,S。;瓦沙夫斯基,A。;Volinsky,C.细胞网络数据中的人类流动特征。Commun公司。ACM公司 2013,56,74–82。[谷歌学者] [交叉参考]
  25. Ranjan,G。;臧,H。;张,Z.L。;Bolot,J.通话详细记录对人类活动性抽样有偏见吗?ACM Sigmobile Mob.公司。计算。Commun公司。版次。 2012,16, 33–44. [谷歌学者] [交叉参考]
  26. 赵,Z。;Shaw,S.L。;Xu,Y。;卢·F。;陈,J。;Yin,L.了解人类流动性研究中呼叫细节记录的偏差。国际地质杂志。信息科学。 2016,30, 1738–1762. [谷歌学者][交叉参考]
  27. O.萨加拉。;Szell,M。;Santi,P。;Díaz-Guilera,A。;Ratti,C.城市流动性的超采样和网络重建。公共科学图书馆 2015. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  28. Xu,Y。;Shaw,S.L。;赵,Z。;尹,L。;方,Z。;Li,Q.使用被动式手机位置数据了解总的人类移动模式:基于家庭的方法。交通运输 2015,42, 625–646. [谷歌学者] [交叉参考]
  29. 韦索洛夫斯基,A。;Eagle,N。;塔特姆,A.J。;史密斯,D.L。;上午Noor。;斯诺,R.W。;Buckee,C.O.量化人类活动对疟疾的影响。科学类 2012,338, 267–270. [谷歌学者] [交叉参考] [公共医学]
  30. 卡拉布雷斯,F。;米·D。;洛伦佐,G.D。;费雷拉,J。;Ratti,C.从城市感知数据中了解个人流动模式:手机追踪示例。运输。研究C部分应急技术。 2013,26, 301–313. [谷歌学者][交叉参考]
  31. Kung,K.S。;Greco,K。;Sobolevsky,S。;Ratti,C.从手机数据探索人类在家工作通勤的普遍模式。公共科学图书馆 2013. [谷歌学者] [交叉参考] [公共医学]
  32. 刁先生。;Zhu,Y。;费雷拉,J。;Ratti,C.从手机痕迹推断个人日常活动:波士顿的一个例子。环境。计划。B计划。设计。 2015,43, 1–25. [谷歌学者][交叉参考]
  33. Yang,X.先生。;方,Z。;Xu,Y。;Shaw,S.L。;赵,Z。;尹,L。;张,T。;Lin,Y.利用手机定位数据了解人类趋同和发散的时空模式。ISPRS国际地理信息杂志。 2016. [谷歌学者] [交叉参考]
  34. Xu,Y。;Shaw,S.L。;方,Z。;Ling,Y.根据手机数据估算自行车出行的潜在需求——基于主持人点的方法。ISPRS国际地理信息杂志。 2016. [谷歌学者] [交叉参考]
  35. 卡拉布雷斯,F。;洛伦佐,G.D。;刘,L。;Ratti,C.使用从波士顿大都市区100万用户中收集的手机位置数据估计起点-终点流量。IEEE普及计算。 2011,10, 36–44. [谷歌学者] [交叉参考]
  36. Xu,Y。;Shaw,S.L。;赵,Z。;尹,L。;卢·F。;陈,J。;方,Z。;Li,Q.关于两个城市的另一个故事:利用主动跟踪的手机位置数据了解人类活动空间。美国地质协会年鉴。 2016,106, 489–502. [谷歌学者]
  37. 袁,Y。;劳巴尔,M。;Liu,Y.手机使用与旅行行为的相关性——以中国哈尔滨市为例。计算。环境。城市系统。 2012,36, 118–130. [谷歌学者] [交叉参考]
  38. 宋,C。;Koren,T。;王,P。;Barabási,A.L.模拟人类流动的缩放特性。自然物理学。 2010,6, 818–823. [谷歌学者] [交叉参考]
  39. 宋,C。;Barabási,A.L.人类流动性可预测性的极限。科学类 2010,327, 1018–1021. [谷歌学者][交叉参考] [公共医学]
  40. 加洛蒂,R。;巴扎尼,A。;Degli Esposti,M。;Rambaldi,S.个体流动模式的熵测度。《统计力学杂志》。理论实验。 2013. [谷歌学者] [交叉参考]
  41. Cuttone,A。;莱曼,S。;González,M.C.了解人类活动的可预测性和探索性。电子打印:arXiv 2016. [谷歌学者]
  42. Tene,O。大数据时代的隐私:重大决策的时代。斯坦夫。法律在线修订 2012,20,42–56。[谷歌学者]
  43. 史密斯,M。;桑戈特,C。;Henne,B。;Von Voigt,G.公共社交媒体中的大数据隐私问题。IEEE国际协调数字。生态系统。Technol公司。 2012. [谷歌学者] [交叉参考]
  44. 尹,L。;王,Q。;Shaw,S.L。;方,Z。;胡,J。;Tao,Y。;Wang,W.重新确定使用手机位置数据进行聚合流动性研究的风险与数据效用。公共科学图书馆 2015. [谷歌学者] [交叉参考] [公共医学]
  45. Haklay,M.自愿提供的地理信息有多好?Openstreetmap和军械调查数据集的比较研究。环境。计划。B计划。设计。 2010,93, 3–11. [谷歌学者] [交叉参考]
  46. Goodchild,M.F。;Li,L.确保志愿地理信息的质量。小争吵。统计。 2012,1, 110–120. [谷歌学者] [交叉参考]
  47. Fu,K。;Chau,M.中国微博空间的现实检验:随机抽样方法。公共科学图书馆 2013. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  48. 哈克利,M。;巴西奥卡,S。;安东尼奥,V。;A、Ather。绘制一个地区的地图需要多少志愿者?莱纳斯定律对志愿地理信息的有效性。制图员。J。 2013,47, 315–322. [谷歌学者] [交叉参考]
  49. Arai,A。;风扇,Z。;Matekenya,D。;Shibaski,R.从人类行为模式的比较角度揭示手机用户的所有权偏见。ISPRS国际地理信息杂志。 2016. [谷歌学者] [交叉参考]
  50. 刘海霞(Liu,H.X.)。;Danczyk,A。;布鲁尔,R。;Starr,R.明尼苏达州手机流量数据评估。运输。Res.Rec.公司。 2008,11,1-7。[谷歌学者] [交叉参考]
  51. 陈,B.Y。;Shi,C。;张杰。;Lam,W.H。;李强。;Xiang,S.最大化准时到达概率的最可靠路径查找算法。运输。B运输。动态。 2016. [谷歌学者] [交叉参考]
  52. Goodchild,M.F.大(地理)数据的质量。对话Hum.Geogr。 2013,, 280–284. [谷歌学者] [交叉参考]
  53. Goodchild,M.F。;南卡罗来纳州戈帕尔。空间数据库的准确性; 泰勒和弗朗西斯:英国伦敦,1989年。[谷歌学者]
  54. 张杰。;Goodchild,M。地理信息的不确定性; CRC出版社:美国纽约州纽约市,2002年。[谷歌学者]
  55. 研究议程:地理编码位置错误在健康GIS研究中重要吗?小争吵。时空流行病学。 2012,, 7–16. [谷歌学者] [交叉参考] [公共医学]
  56. 卢,S。;方,Z。;Shaw,S.L。;张,X。;Yin,L.空间尺度对城市内人口流动影响的定量分析。Geomat公司。信息科学。武汉大学。 2016,41, 1199–1204. [谷歌学者]
  57. 雅各布斯,A.大数据的病理学。Commun公司。ACM公司 2009,52,36–44。[谷歌学者] [交叉参考]
  58. 2012年深圳统计年鉴。在线可用:http://www.sztj.gov.cn/nj2012/indexh.htm(2016年9月12日访问)。
  59. 2015年深圳市规划国土资源委员会白皮书。在线可用:http://www.szfdc.gov.cn/xxxk/ghjh/td/201508/t20150813_108651.html(2016年12月3日访问)。
  60. Fotheringham,A.S。;O'Kelly,医学博士。空间交互模型:公式和应用; Kluwer学术出版社:美国马萨诸塞州波士顿,1989年。[谷歌学者]
  61. 莱梅肖,S。;Hosmer,D.W.,《拟合优度统计在逻辑回归模型开发中的应用综述》。美国流行病学杂志。 1982,116, 92–106. [谷歌学者]
图1。一个用户轨迹的示例。显然,与轨迹相交的大多数Voronoi细分都没有记录。
图1。一个用户轨迹的示例。显然,与轨迹相交的大多数Voronoi细分都没有记录。
伊吉06 00007 g001
图2。深圳的位置(摘自OpenStreetMap)。
图2。深圳的位置(摘自OpenStreetMap)。
伊吉06 00007 g002
图3。手机塔空间内核密度。由于数据集提供商的要求,无法显示基于点的手机塔空间分布。根据深圳市规划国土资源委员会的白皮书,深圳市行政边界矢量化为形状文件[59].
图3。手机塔空间内核密度。由于数据集提供商的要求,无法显示基于点的手机塔空间分布。根据深圳市规划国土资源委员会的白皮书,深圳市行政边界矢量化为形状文件[59].
伊吉06 00007 g003
图4。用户记录的时间覆盖范围。
图4。用户记录的时间覆盖范围。
伊吉06 00007 g004
图5。将每个订阅者的记录划分为24个时间段。
图5。将每个用户的记录分为24个时间段。
伊吉06 00007 g005
图6。用于选择不同数量时间段的随机规则。
图6。用于选择不同数量时间段的随机规则。
伊吉06 00007 g006
图7。人类流动性指标分为3个随机段(段#2、段#14和段#20)。浅灰色点是用于每个订户的三个随机且完整的移动性指示符。对于总行程和回转半径,水平轴的带宽为0.1 km。对于运动熵,横轴为0.01带宽。红点是灰点在其相应带宽中的平均值。
图7。人类流动性指标分为3个随机段(段#2、段#14和段#20)。浅灰色圆点是每个用户的三个随机且完整的移动指示器。对于总行程和回转半径,水平轴的带宽为0.1 km。对于运动熵,横轴为0.01带宽。红点是灰点在其相应带宽中的平均值。
伊吉06 00007 g007
图8。10个随机段(段#5、段#6、段#7、段#9、段#11、段#12、段#14、段#16、段#17和段#19)的人类流动性指标。浅灰色圆点是每个用户的三个随机且完整的移动指示器。对于总行程和回转半径,水平轴的带宽为0.1 km。对于运动熵,横轴为0.01带宽。红点是对应带宽中灰点的平均值。
图8。10个随机段(段#5、段#6、段#7、段#9、段#11、段#12、段#14、段#16、段#17和段#19)的人类流动性指标。浅灰色圆点是每个用户的三个随机且完整的移动指示器。对于总行程和回转半径,水平轴的带宽为0.1 km。对于运动熵,横轴为0.01带宽。红点是对应带宽中灰点的平均值。
伊吉06 00007 g008
图9。23个随机段(段#0、#1、#2、#3、#4、#6、#7、#8、#9、#10、#11、#12、#13、#14、#15、#16、#17、#18、#19、#20、#21、#22和#23)的人类流动性指标。浅灰色圆点是每个用户的三个随机且完整的移动指示器。对于总行程和回转半径,水平轴的带宽为0.1 km。对于运动熵,横轴为0.01带宽。红点是对应带宽中灰点的平均值。
图9。23个随机段(段#0、#1、#2、#3、#4、#6、#7、#8、#9、#10、#11、#12、#13、#14、#15、#16、#17、#18、#19、#20、#21、#22和#23)的人类流动性指标。浅灰色点是用于每个订户的三个随机且完整的移动性指示符。对于总行程和回转半径,水平轴的带宽为0.1 km。对于运动熵,横轴为0.01带宽。红点是对应带宽中灰点的平均值。
伊吉06 00007 g009
图10。使用不同数量的时间段估计总行程的聚合低估系数分布。
图10。使用不同数量的时间段估计总行程的聚合低估系数分布。
伊吉06 00007 g010
图11。使用不同数量的时间段估计运动熵的聚合低估系数的分布。
图11。使用不同数量的时间段估计运动熵的聚合低估系数的分布。
伊吉06 00007 g011
图12。使用不同数量的时间段估计回转半径的聚合低估系数分布。
图12。使用不同数量的时间段估计回转半径的聚合低估系数分布。
伊吉06 00007 g012
表1。个人一天内的手机记录示例。
表1。个人一天内的手机记录示例。
用户ID日期时间经度纬度
用户12012/**/**05:28:37114. *****22. *****
用户12012/**/**11:07:52114. *****22. *****
用户12012/**/**13:51:12114. *****22. *****
用户22012/**/**02:28:16114. *****22*****
*****号忽略经度或纬度的分钟数,**/**号忽略确切的月份和日期,以保护隐私。
表2。不同随机时间段的流动性指标统计。
表2。不同随机时间段的流动性指标统计。
时间段 总行驶距离运动熵回转半径
3 (#2, #14, #20)高估0%11.67%17.16%
估计不足100%88.33%82.84%
聚合加州大学0.860.490.48(9公里以内)
R(右)2(加州大学)0.2910.9430.901
10 (#5, #6, #7, #9, #11, #12, #14, #16, #17, #19)过高估计0%32.79%19.42%
估计不足100%67.21%80.58%
聚合加州大学0.520.180.34(9公里以内)
R(右)2(加州大学)0.8940.9860.882
23(#5除外)过高估计0%59.28%8.94%
估计不足100%40.72%91.06%
聚合加州大学0.050.010.29(9公里以内)
R(右)2(加州大学)0.9950.9990.882

分享和引用

MDPI和ACS样式

卢,S。;方,Z。;张,X。;肖,S.-L。;尹,L。;赵,Z。;X·杨。在描述人的流动性指标时,了解移动电话位置数据的代表性。ISPRS国际地理信息杂志。 2017,6, 7.https://doi.org/10.3390/ijgi6010007

AMA风格

Lu S、Fang Z、Zhang X、Shaw S-L、Yin L、Zhao Z、Yang X。在描述人的流动性指标时,了解移动电话位置数据的代表性。国际地理信息杂志. 2017; 6(1):7。https://doi.org/10.3390/ijgi6010007

芝加哥/图拉宾风格

Lu、Shiwei、Zhixiang Fang、Xirui Zhang、Shih-Lung Shaw、Ling Yin、Zhao Zhiyuan和Xiping Yang。2017.“了解移动电话位置数据在表征人的流动性指标方面的代表性”国际地理信息杂志6,编号1:7。https://doi.org/10.3390/ijgi6010007

请注意,从2016年第一期开始,该杂志使用文章编号而不是页码。请参阅更多详细信息在这里.

文章指标

返回页首顶部