作者:常晓龙 张晖极性词典语素模型同义关系图模型标签传播
摘要:针对传统语素方法对于种子词语数量的依赖和传统图方法召回率较低的问题,提出一种将词语间语素关系融入到图模型中,并结合词语同义关系进行中文褒贬词典半监督构建的方法。首先利用语素模型计算词语间语素相似度;然后利用同义词林和双语词典资源,构建词语间同义关系;最后将二种关系结合,并利用标签传播(LP)算法进行词语的褒贬分类。实验结果表明,所提方法具有较高的准确率和召回率,微平均F1值最高可达92.8%;并降低了对种子词语数量的依赖,当种子词语数量仅为100时,微平均F1值依然可达到84.1%。除此之外,所提方法还具有快速收敛的特性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社