作者:李顺; 张圣华; 朱美正; 高龙模式挖掘分布式
摘要:对于传统的爬虫技术,爬取轨迹数据时存在较低的覆盖率和效率,文中基于云计算技术架构构建了一套高效的分布式多源异构时空数据爬虫系统。由于系统以分秒级别获取基于timestamp的轨迹数据,而存储、计算等无法支持巨大的数据量,文中在TDTR算法的基础上,提出了一种基于T-Map(MCTD)的距离计算公式计算轨迹间距离的轨迹压缩算法(STCA),减少了需要的存储空间。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《信息技术》(CN:23-1557/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《信息技术》的办刊宗旨是:大力宣传国家信息基础建设和信息产业发展形势,深入报导国内外信息技术(产品)发展趋势,交流信息化建设经验,推介信息产业界精英及其管理思想,提供信息技术(产品)市场前景与分析。
省级期刊
人气 652321 评论 60
部级期刊
人气 443598 评论 71
人气 366733 评论 69
人气 252433 评论 66