作者:陈睿嘉; 康志忠; 张卫涛poi深度服务信息网络爬虫dom编辑距离最大公共子序列
摘要:根据近来对地理信息Web服务搜索引擎的研究,设计一种基于网络爬虫自动采集POI(Point Of Interest)深度服务信息的方法。使用网络爬虫与DOM(Document Object Model)技术从相关POI深度服务信息的网站抓取实时信息,并通过编辑距离与针对地址匹配的改进最大公共子序列分析页面内容与POI主题相关度,进而将相关度最高的深度服务信息与POI点匹配,生成深度服务信息点特征。实验证明了方法的有效性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社