几种文本特征降维方法的比较分析

作者：高茂庭; 王正欧文本挖掘降维随机映射非负矩阵分解概念索引隐含语义分析

摘要：文本挖掘中采用向量空间模型（VSM）来表达文本特征,表现出巨大的维数,从而导致处理过程计算复杂,为此,需要先对文本特征矩阵进行合理的降维处理.隐含语义分析（LSA）、概念索引（CI）、非负矩阵分解（NMF）和随机映射（RP）是几种有效的降维方法,在分析降维空间的含义和计算复杂度后,通过文本聚类实验比较和分析了这几种降维方法的差异,实验表明,这些方法不仅可以对文本特征空间作有效的降维处理,还能在不同程度上凸现文本和词条之间的语义关系,从而提高文本挖掘的效率和准确率.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机工程与应用

《计算机工程与应用》（CN：11-2127/TP）是一本有较高学术价值的大型半月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

计算机工程与应用相关期刊

几种文本特征降维方法的比较分析

服务推荐

在线咨询

杂志订阅

期刊推荐

网友世界

计算机光盘软件与应用

计算机与网络

计算机仿真