作者:马丹 王翰虎 陈梅 张小平深层网络查询接口k近邻算法分类
摘要:随着Internet的发展,Web正在不断深入人们的生活。传统搜索引擎只能检索浅层网络(Surface Web),不能直接索引到深层网络(Deep Web)的资源。为了有效利用Deep Web资源,对Deep Web数据源发现并进行领域类别的划分,已成为一个非常迫切的问题。该模型首先抽取Deep Web页面查询接口的特征,构造了一个Deep Web页面过滤器,从而能够发现Deep Web的数据源,其次在对查询接口特征进行分析后,构建了一个基于KNN的分类器,并通过该分类器对新产生的Deep Web数据源进行领域分类。试验结果表明,这种模型的平均分类准确率达到86.9%,具有良好的分类效果。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社