作者:门宇鹏; 郝晓燕; 董嘉敏框架排歧多分类支撑向量机语义依存分析交叉验证
摘要:为大规模自动构建语料库,使计算机能够理解文本信息,提出框架自动识别,框架排歧作为框架识别的子任务,是亟待解决的。框架排歧即根据目标词的上下文信息,从现有的框架库中,自动为该目标词标注一个合适的框架。利用分类算法的思想,使用支持向量机(SVM)中的“一对一”方法建立多个分类器来解决多分类问题。通过向已有的词性与依存句法关系特征之上再加入语义依存分析关系特征来提升框架排歧的准确率。训练语料和测试语料为山西大学建立的汉语框架语义知识库(CFN)中的7个词元,1519条例句,采用5-fold交叉验证。实验取得的最好结果为80.67%,验证了语义依存分析对框架排歧的有效性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社