改进的TFIDF标签提取算法

作者：王杰; 李旭健自然语言处理tfidf词加权算法标签提取监督学习

摘要：TFIDF算法作为一种加权算法,在信息检索和数据挖掘等自然语言处理领域发挥了巨大的作用。它的计算模型相对简单,适合大数据并行计算,适用领域广泛,且拥有很好的解释性。基于以上这些特点,本文在TFIDF算法基础之上,利用监督的学习,并通过引入加权因子和词贡献度,来修正TFIDF算法结果权值。利用这个算法可以在自然语言处理中有效地提取特征标签,并且改进后的算法在这一细分领域具有极高准确度。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

软件工程

《软件工程》（CN：21-1603/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《软件工程》提供工厂技术及管理信息，营造信息时代的软件工程师文化。为中国软件行业协会会刊，被中国期刊全文数据库、中国知网、龙源期刊网、万方数字——数据期刊群以及中国优秀期刊（遴选）数据库等全文收录。

杂志详情

服务推荐

软件工程相关期刊

改进的TFIDF标签提取算法

服务推荐

在线咨询

杂志订阅

期刊推荐

中国组织工程研究

科学技术与工程

计算机光盘软件与应用

价值工程