HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

网络竞争情报主题采集技术研究

作者:田雪筠竞争情报主题爬虫链接过滤主题过滤

摘要:文章设计与实现了一种网络竞争情报的主题采集系统。该系统在进行主题预测时采用的基于改进的朴素贝叶斯算法提高了主题判断准确率,在进行链接预测时采用的基于规则与锚文本主题相似度结合的算法,避免了URL锚文本较短和噪声的问题。与宽度优先的采集技术相比,通过实验验证该方法具有明显的优越性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

图书与情报

《图书与情报》(CN:62-1026/G2)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《图书与情报》1989年被中国图书馆学会授予“全国图书馆学情报学优秀科研成果特别奖”。2006年10月,连续六次获得中国图书馆学会编译委员会授予的“全国优秀图书馆学期刊”,是全国12家入选期刊之一。

杂志详情