作者:杨超; 朱东华; 衡晓帆; 汪雪锋语法树语义分析共现算法主题词簇
摘要:[目的/意义]SAO是一种能够表示主题信息和主题间关系的3元组结构,是文献计量学领域一个快速发展的研究方向。为了获得“满足文献计量分析需求的SAO结构”,需要解决现有SAO结构识别方法遭遇的3个问题:查全和查准率低、所识别SAO结构和领域主题相关性不强以及矩阵稀疏性。[方法/过程]提出一种面向文献计量分析的基于语法树的SAO结构识别方法,首先基于共现算法和“主题词簇”方法(termclumping)识别SAO核心组件,然后利用基于语法树的抽取算法实现SAO结构的逐层抽取。[结果/结论]案例研究发现,该方法的平均查准率为0.8058,平均查全率为0.8446,所识别SAO结构与领域主题关系较强,且矩阵稀疏性也得到较好改善,可有效应用于相关文献计量分析。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社