新闻中心

EEPW首页 > 设计应用 > 应用手机GPS数据预测交通流速度

应用手机GPS数据预测交通流速度

作者:韦义明时间:2016-06-28来源:电子产品世界收藏
编者按:准确估计交通状况,定位交通拥堵是方便人们出行的重要一步。利用手机GPS信息,预测交通拥堵具有很广阔的应用前景。本文采用基于主成分分析的多元线性回归的方法构建预测模型,利用GPS定位数据对短时交通流速度进行预测。实验结果表明,基于手机GPS数据所构建的回归模型能够对交通流速度进行有效的预测。

摘要:准确估计交通状况,定位交通拥堵是方便人们出行的重要一步。利用手机GPS信息,预测交通拥堵具有很广阔的应用前景。本文采用基于的多元线性回归的方法构建预测模型,利用GPS定位数据对短时交通流速度进行预测。实验结果表明,基于所构建的回归模型能够对交通流速度进行有效的预测。

本文引用地址:http://www.eepw.com.cn/article/201606/293266.htm

引言

  近年来,智能手机的使用越来越普及。便捷的手机网络可以解决交通预测过程中遇到的覆盖区域限制和实时性差等问题,与此同时,GPS定位准确性高,可以作为目标点的交通探测器使用[1],收集定点的实时数据用于交通流速度预测。分析实时交通情况,提供相应的信息服务,对于缓解交通堵塞变得尤为重要。传统交通流速靠地感线圈数据进行估算和预测,而地感线圈覆盖范围小、造价高且普及率低下。随着手机等移动终端的普及,无线运营商可以利用手机的通话数据、短信数据、手机在基站间的切换数据、手机所处基站的位置数据以及手机信息量的变化反映路段交通流速度,转而利用统计模型方法对交通状况进行分析和估计[2],依靠手机收集到的道路信息去训练统计模型,然后利用该模型来估计和预测相应路段的交通情况。基于手机的GPS信息[3]估计和预测相应路段的行程时间和拥堵状况,可以为手机持有者提供便捷的信息服务,具有广阔的应用前景和实实在在的价值。

  本文在的基础上,提出了一种基于和多元线性回归的方法,对交通流进行预测和分析,进而向客户提供交通路况服务信息。

1 处理

  GPS数据的收集过程会受到外界多方面因素的影响,而使得GPS数据的质量会出现误差。这些误差形成的原因大多是不可避免的,因此,对手机GPS数据产生的影响是难以避免的。所以当获得手机GPS数据以后,不能够直接用来对交通流进行估计和预测。不然,如果直接将误差比较大的数据用于估计交通流的平均速度,这样必然会因误差传递使得估计的准确性产生较大的影响。为了降低数据误差产生的不利影响,首先应该对原始数据进行处理。

  原始数据因受影响的程度不同可以分为两种:一种是有较小偏差的数据,另一种是出现错误的数据。针对不同的数据应该采取不同的措施进行预处理。对于错误数据,应该剔除;有细微偏差的数据,应该对其进行修正,保证数据能够投影到合理的路段网络上。错误数据通常是由于GPS卫星信号在传输过程中受到比较严重的干扰产生的,例如遇到较为密集的大型建筑群、比较茂密的森林树木或电磁波等发生突变,使得定位数据发生严重偏离历史轨迹的现象。因为这一类数据基本不能够反映出车辆行驶的情况,所以不能代表车辆的正确位置,需要从原始数据中删除。对于这类错误,通常采用阈值检验法进行判断,该方法假设行驶车辆车速的合理值是固定的范围,当某一速度超出这个合理的范围,也就说明该数据是错误数据,需要进行剔除。偏差数据通常是由于GPS定位误差导致的,这是经常发生的,对于这类数据应该认为是正常数据。对这类数据也需要进行修正,通常的修正方法是电子地图匹配的算法[4,5]。该方法将手机GPS数据投影到地图上,并根据投影后的数据点向匹配的路段做垂线,那么与匹配路段上的交点即为该数据点的匹配位置。如图1所示是匹配位置的示意图,根据该图可以求得实际的GPS数据点p的位置:

(1)

(2)

  其中,x1,y1分别是路段端点1的经纬度坐标,x2,y2分别是路段端点2的经纬度坐表,x3,y3分别是当前手机GPS定位数据上的经纬度坐表。

2 的多元线性回归模型

2.1 主成分分析

  主成分分析[6]的主要目的是在保证原始数据信息损失最小的前提下,经过线性变换和舍弃部分信息,从而能够以少数的综合变量取代原始采用的多维变量。在提取的所有主成分中,第一主成分包含有能够解释的最多的变量信息,第二主成分包含能解释的次多的变量信息,最后一个主成分包含最少的变量信息。

  主成分分析的主要步骤是:

  1)根据原始数据X,求X自相关矩阵的特征值、特征向量;

  2)按照特征值大小将特征向量排序;

  3)按照贡献比例找出较大的特征向量构成的子空间;

  4)将原始数据X每一行向子空间上投影所得的坐标,即为降维以后的坐标;

  5)计算主成分。

2.2 基于主成分分析多元线性回归

  多元线性回归是多元统计分析中的一个重要方法,该方法根据历史的样本数据,在不需要知道未来样本数据的情况下,建立多元线性回归模型,预测未来时刻回归模型的回归参数。其基本模型方程为:

(3)

  其中,a1,a2,…,an为模型参数。

  利用多元线性回归模型进行交通流速度的预测时,可以很容易地通过最小二乘法[7]进行求解。为了进一步利用原始交通流的数据信息,进一步确定不同交通流的贡献率,确定不同路段的交通情况,基于主成分分析的方程为:

(4)

  其中,xi表示主成分分析得出的因子的分变量,p是提取的主成分的个数,b表示未被利用的数据信息误差。对上式进行标准化后得到:

(5)

  其中,Bi为所求多元线性回归系数。

3 实验结果和分析

  本文的数据为我国某城市主要交通路段A点到B点这段上的数据,本文的预测对象即为这段路段上的交通流速度。本文从A到B的数据中提取一个64维的向量,包括前4个时刻的手机通话量、短信量、基站切换数目和出租车的GPS平均速度值,共16维。由于相邻路段的车辆对该路段会有影响,因此又考虑相邻4个路段上相应的16维数据,共16×4=64维数据。本文中用到的数据共1052条,其中600条数据作为训练集,452条数据作为测试集,分别进行试验预测交通流速。

  在训练集上进行的结果以及相应的误差曲线如图2所示。图2(a)中的原始数据表示实际的交通流速度Y,预测曲线表示利用主成分分析多元线性回归拟合出的交通流速度值YP。从该图中可以看出,在交通流速峰值处,预测值与真实值存在着明显的差异,除了峰值外,多元线性回归方法大体上能够预测出交通流的速度。图2(b)中的误差曲线更形象地给出了实际值与预测值之间的差异。

  测试集上进行的结果以及相应的误差曲线如图3所示。图3(a)中原始数据曲线表示测试集上实际的交通流速度Y,预测曲线表示测试集上预测的交通流速度YP。从测试集也可以看出,类似于训练集上的情况也出现了,交通流速峰值处出现的预测误差较大。针对实验的结果,可能是当交通流速较大的时候,道路的流通比较通畅,车辆的行驶速度就快,手机GPS的定位有一定的延迟,没能精确地反应出当时汽车行驶的速度,不过这也恰好说明了当时的道路情况并没发生拥堵现象,方便人们出行。而该方法对于交通流速较低地方在误差允许范围内能够准确地预测出该处的交通流速,进而能够判断出,流速比较慢的地方发生了拥堵现象,此刻该路段不适宜出行。

4 总结

  本文利用手机GPS数据,采用基于主成分分析的多元线性回归的方法构建预测模型,能够有效地对交通流速进行预测和道路拥堵情况进行判断。城市交通堵塞问题,对于人们的日常出行会造成困扰,甚至会给人们造成较大的经济损失。利用手机GPS数据进行道路情况预测和判断的思路和方法,如果能在实际生活中得到应用,将为人们的出行提供相应的信息服务,方便了人们的生活。

参考文献:

  [1]Rose G. Mobile phones as traffic probes: practices, prospects and issues[J]. Transport Reviews, 2006, 26(3): 275-291.

  [2]Herring R, Hofleitner A, Amin S, et al. Using mobile phones to forecast arterial traffic through statistical learning[C]//89th Transportation Research Board Annual Meeting, Washington DC. 2010.

  [3]Minh Q T, Kamioka E. Pinpoint: An Efficient Approach to Traffic State Estimation System Using Mobile Probes[C]//Wireless Communications Networking and Mobile Computing (WiCOM), 2010 6th International Conference on. IEEE, 2010: 1-5.

  [4]王志建, 王力, 汪健. 基于拓扑判断的海量 GPS 数据延时地图匹配算法[J]. 西南交通大学学报, 2012, 47(5): 861-866.

  [5]吴昊, 刘岩, 吴北平. GPS 车辆监控系统道路匹配算法研究与实现[J]. 全球定位系统, 2013, 38(4): 83-87.

  [6]Dunteman G H. Principal components analysis[M]. Sage, 1989

  [7]刘钦圣.最小二乘问题计算方法[M].北京:北京工业大学出版社,1989.

本文来源于中国科技期刊《电子产品世界》2016年第6期第67页,欢迎您写论文时引用,并注明出处。



评论


技术专区

关闭