作者:赵禛; 程良伦情感倾向情感词典情感标注
摘要:目前情感分析方法大致分为基于情感词典的情感分析和基于机器学习的情感分析.但中文存在多样的句式和表达,情感词典的不完善将直接影响最后的分类结果导致分析精度不高.而基于机器学习的分析结果取决于训练样本的选择和正确的情感标注需要大量人工并且局限于已标注的应用领域.本文选取部分数据集,首先利用基本情感词典粗略估计这些文本的情感值,选取分值较高和较低的文本最为已标注情感的训练样本,在结合三种机器学习算法进行综合分析.解决了单一方法的应用领域局限性并保证了较高的准确率.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社