作者:郭崇慧; 曹梦月共词分析g指数互信息ap聚类
摘要:摘要文献计量学领域中的共词分析方法主要分为三个阶段:术语收集阶段、共现频率统计阶段以及聚类分析阶段,传统共词分析方法在以上三个阶段存在主观性过强、信息量不足,聚类不稳定、成员划分不合理、类团解释缺少语义分析等问题,导致了领域主题发现容易存在偏差。本文针对传统共词分析方法存在的缺陷提出了一种新的共词分析方法——GMAP共词分析方法,即将g指数、互信息概念以及AP聚类算法融入共词分析方法中。首先,使用g指数确定高频关键词的个数;其次,使用互信息概念对共现矩阵进行包容化处理;最后,使用AP算法进行聚类得出领域主题。为了验证GMAP的可行性和有效性,对中国古村落(传统村落)领域文献进行数值实验,结果显示GMAP共词分析法优于传统共词分析方法,为改进共词分析方法提供了一个新的研究思路。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社