作者:易顺明; 易昊; 周国栋推文情感分类情感词典情感特征向量
摘要:面向公共媒体内容开展情感分析是分析公众情感的一项基础工作.经典的基于词频特征向量的特征提取方法,主要利用词频作为文本分类的依据,而词频与情感信息之间的关系并不紧密.提出一种采用基于情感特征向量的Twitter推文情感分类方法.该方法首先通过对推文进行数据清洗、词形还原、词性标注和词汇向量化;其次,将单词匹配到情感词典中;最后,利用每个单词的正向情感、负向情感取值生成情感特征向量,通过MNB、SVM等机器学习方法训练模型,对推文的情感进行分类.实验结果表明采用情感特征向量的Twitter推文情感分类方法能够获得更佳的分类性能.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社