作者:常娟短文本分类k近邻朴素贝叶斯支持向量机
摘要:近年来,各种短文本数据已经源源不断地大量涌现,如文章摘要、电子邮件、网上即时消息等,虽然文本分类技术在一些领域已经得到了很好的研究应用,但针对这些长度比较短、结构各异的短文本数据的分类研究则比较少。实际上,为方便用户使用对它们进行分类研究应用已经非常必要。本文在现有研究基础上,对目前几种常用的文本分类算法进行了分析研究,依据实验数据,分析比较出SVM算法在对短文本数据分类时具有良好的分类性能,并提出改进意见,以供参考。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社