作者:张敏; 杜华垂直搜索引擎中文分词文本分类主题相关度nutch
摘要:面对日益专业和个性化的信息检索需求,通用搜索引擎存在的问题暴露无遗。垂直搜索技术作为搜索引擎发展的一个主要方向,正在受到越来越多的关注。在给出一个垂直搜索引擎总体结构的基础上,详细分析了所涉及的关键技术:网页抓取、中文分词、文本分类等。并将分词和分类算法加入到Nutch中,实现了系统原型。实验证明,该系统主题相关度达到94%以上。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《情报科学》(月刊)创刊于1980年,由国家教育部主管,中国科学技术情报学会、吉林大学主办,CN刊号为:22-1264/G2,自创刊以来,颇受业界和广大读者的关注和好评。 《情报科学》内容涉及高校图书馆网络化建设、现代信息业发展、多媒体技术、情报人员结构等方面,本着求实创新的理念,始终站在学科研究的前沿,全面反映学科发展的动态,着力突出刊物与时俱进的时代特征,抓住图书情报界的研究热点,刊发了一大批既有理论水平,又有学术影响的重要论文,及时反映了情报学、信息管理、图书馆学等诸领域的最新研究进展。
省级期刊
人气 753866 评论 72
人气 653264 评论 60
人气 484710 评论 71
人气 464628 评论 66