HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于扩充词汇链改进的关键词提取算法

作者:王小林; 朱磊; 邰伟鹏关键词提取区域特征词语相似度有效权重词汇链义原

摘要:关键词的准确提取在文本分类、文本聚类、信息检索等方面起着重要作用.现有的基于词汇链的关键词提取方法在计算词语相似度时,赋予第-类独立义原系数的值最大并且通过第-类独立义原相似度约束其他三类义原相似度;通过区域特征和词频提取关键词时,词语的权重依赖词汇链的长度,不能充分利用区域特征等问题.为了提高关键词的提取准确率,计算词语相似度时,用对比的两个词语每类义原个数的和与四类义原个数总和的比值大小排序后动态的获取系数取代固定系数,并且去除每类义原受到前面所有义原类的约束;提取关键词时,用词汇链的有效权重替代词汇链的长度.实验结果表明:改进后的算法较传统的算法提高了准确率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

苏州科技大学学报·自然科学版

《苏州科技大学学报·自然科学版》(CN:32-1871/N)是一本有较高学术价值的大型季刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《苏州科技大学学报·自然科学版》主要刊登:数学、物理学、理论力学、计算力学、化学、材料科学、生命科学、地理科学、环境科学、计算机科学、信息技术、电子信息科学等自然科学领域内各学科的基础研究、应用研究方面的学术论文。

杂志详情