HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于类内分布信息的文本特征提取方法

作者:毛大鹏特征提取复杂网络类内分布pagerank算法

摘要:针对共现网络中节点相关度计算只考虑了词语在文本共现的频率,忽略了词语在类内分布信息的问题进行了研究,提出了一种利用类内特征分布信息的特征提取方法,采用复杂网络表示文本,词语映射成网络的节点,词语之间的关系映射成网络节点的有向边。在此基础上,将网络节点的相关度作为复杂网络的有向边的权重,利用类内分布TFIDF计算节点自身权重,对构建的文本网络采用改进的PageRank算法计算网络节点的重要性,以此为指标进行特征提取。仿真实验结果表明,提出的特征提取方法结果更准确。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

信息与电脑

《信息与电脑》(CN:11-2697/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《信息与电脑》致力于打造一个政府及相关职能部门、研究机构、信息化软硬件及解决方案供应商、科技人才共同交流的平台,在内容上既注重信息化前沿科技,又立足现实应用的"虚实协调"策略。

杂志详情