随着车载GPS的普及和汽车智能网联化的推广应用,汽车行业积累了海量的车辆轨迹数据。这些数据表征着人们的出行意图,具有丰富的应用价值,如移动位置推荐、出行线路规划和智慧交通等智能位置服务。智能位置服务的核心是基于车辆轨迹数据的位置预测技术,其中对车辆出行目的地的预测是研究的热点和难点,为解决现有预测方法中预测精度和计算效率较低的问题,提出了基于多源数据和深度学习的车辆出行目的地预测方法。
首先,在数据预处理及分析中,通过对轨迹数据进行坐标转换、轨迹分割、异常检测、网格编码和冗余处理操作,消除了数据噪声,过滤了异常数据,简化了轨迹表征形式;通过对出租车运营数据、地理兴趣点数据、行程起终点数据和天气数据进行分析,探索了时间、兴趣点和天气对居民出行的影响规律,为后续的特征工程提供依据。
其次,在特征工程中,提出了基于Geo2vec的轨迹网格表征方法,改善了表征效果,解决了未登陆词问题;提出了基于循环编码的时间数据表征方法,解决了时间数据循环特性难以表征的问题;提出了基于OD-POI状态转移概率矩阵的地理兴趣点表征方法,解决了兴趣点数据挖掘不充分的问题。研究表明,在平均距离偏差和均方根距离偏差上,Geo2vec相比于Word2vec分别降低了4.31%和5.03%,循环编码相对于标签编码分别降低了4.33%和5.88%,基于OD-POI状态转移概率矩阵的方法相对于基于起点概率的方法分别降低了3.37%和4.38%,基于多源数据的模型相比于仅基于轨迹数据的模型分别降低了14.67%和18.21%;在数据维度上,循环编码相对于独热编码在数据维度上减少了48.66%。
最后,在算法研究中,提出了基于多头自注意力机制的时间卷积神经网络,并将其应用于车辆出行目的预测领域,提高了预测精度,解决了现有算法计算效率低的问题。研究表明,该模型相比于常用的循环神经网络,在模型训练和预测时间上分别减少了63.51%和80.92%,同时在平均距离偏差和均方根距离偏差上分别降低了5.24%和6.82%。
本文所提出的基于多源数据的车辆出行目的地预测方法可有效地提高预测精度和计算效率,为该领域的研究提供了新的方法,具有较强的工程应用价值。