基于训练样本集扩展的隐式篇章关系分类

作者：朱珊珊; 洪宇; 丁思远; 严为绒; 姚建民; ...隐式篇章关系语义向量训练样本集扩展篇章分析

摘要：隐式篇章关系分类主要任务是在显式关联线索缺失的情况下,自动检测特定论元之间的语义关系类别。前人研究显示,语言学特征能够有效辅助隐式篇章关系的分类。目前,主流检测方法由于缺少足够的已标注隐式训练样本,导致分类器无法准确学习各种分类特征,分类精确率仅约为40%。针对这一问题,该文提出一种基于训练样本集扩展的隐式篇章关系分类方法。该方法首先借助论元向量,以原始训练样本集为种子实例,从外部数据资源中挖掘与其在语义以及关系上一致的＂平行训练样本集＂;然后将＂平行训练样本集＂加入原始训练样本集中,形成扩展的训练样本集;最后基于扩展的训练样本集,实现隐式篇章关系的分类。该文在宾州篇章树库（Penn Discourse Treebank,PDTB）上对扩展的训练样本集进行评测,结果显示,相较于原始训练样本集,使用扩展的训练样本集的实验系统整体性能提升8.41%,在四种篇章关系类别上的平均性能提升5.42%。与现有主流分类方法性能对比,识别精确率提升6.36%。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

中文信息学报

《中文信息学报》（CN：11-2325/N）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

中文信息学报相关期刊

基于训练样本集扩展的隐式篇章关系分类

服务推荐

在线咨询

杂志订阅

期刊推荐

现代经济信息

中国科技信息

佳木斯教育学院学报

中国信息技术教育