作者:毛大鹏特征提取复杂网络类内分布pagerank算法
摘要:针对共现网络中节点相关度计算只考虑了词语在文本共现的频率,忽略了词语在类内分布信息的问题进行了研究,提出了一种利用类内特征分布信息的特征提取方法,采用复杂网络表示文本,词语映射成网络的节点,词语之间的关系映射成网络节点的有向边。在此基础上,将网络节点的相关度作为复杂网络的有向边的权重,利用类内分布TFIDF计算节点自身权重,对构建的文本网络采用改进的PageRank算法计算网络节点的重要性,以此为指标进行特征提取。仿真实验结果表明,提出的特征提取方法结果更准确。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社