作者:厉宇航; 罗振声; 程慕胜自动文本分类概念层次vsmwordnet
摘要:该文意在设计并且实现一个针对英文文本的自动归类以及检索系统,重点在于提高分类方法的准确率。自动文本分类系统中,一般来说文本内容是以N维特征空间的形式存储的,所以特征提取的方法和准确率极大地影响到分类结果的正确率。传统方法是基于词形的,并不考察词语的意义,忽略了同一意义下词形的多样性、不确定性以及词义之间的关系,尤其是上下住关系。该文提出的方法,在向量空间模型(VSM)的基础上,以“概念”为基础,同时考虑词义的上住关系,使得训练过程中可以从词语中提炼出更加概括性的信息,从而达到提高分类精度的目的。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社