作者:张贵军突发事件共指消解维基百科语义特征最大熵模型
摘要:文章以突发事件新闻语料为研究背景,深度挖掘维基百科作为消解的背景语义知识,提炼出四类基于维基百科的特征,分别是解释网页内容的特征、同义词的特征、链接图的特征和分类图的特征。在标注的20万字语料上进行训练与测试,经过实验测试,证明将维基百科引入突发事件共指消解是一个有效的方法,系统F值为66.7%,其中,基于维基百科链接图的特征对系统贡献最大。利用爬山算法的SBS算法做特征选择,在剔除掉7个特征之后,使得系统F值提升了3.58%。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社