谷歌浏览器插件
订阅小程序
在清言上使用

基于Hive的海量公交客流起讫点挖掘方法

Science Technology and Engineering(2020)

引用 0|浏览5
暂无评分
摘要
目前起讫点(origin-destination,OD)挖掘方法普遍存在无法并行分析多条线路、低效率、预测率不足的问题.考虑到Hive在海量数据上的查询性能优势,基于Hive实现了OD挖掘,克服了上述问题.基于时间阈值匹配上车站点,失配记录基于站点上客数再次匹配.基于表连接的出行链算法预测下车站点,预测失败的记录基于概率进行两次预测.以石家庄2018年1月1日—2018年3月27日的IC卡刷卡数据和调度数据进行OD挖掘,在清洗后的11312505条出行记录中挖掘出11270037条OD记录,预测率达到99.6%,出行与吸引校验质量较高,Hive并行调优开启后耗时17829.04 s.可见该方法满足生产环境中离线挖掘OD的业务需求.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要