作者:王刚; 李宁宁; 杨善林文本情感分析半监督学习多分类器randomsubspace
摘要:随着社交媒体的不断普及,网络上出现了大量用户创造的文本信息。这类文本所包含的用户的观点、意见和态度等情感信息,对于互联网用户有着重要的作用,已受到越来越多的重视,并已提出大量有监督的文本情感分析方法来利用这些数据。但文本情感分析中存在大量无标记样本,如何利用大量无标记样本和少量有标记样本进行学习的问题,已成为了文本情感分析领域亟待解决的问题之一。为此,本文提出一种改进的半监督文本情感分析方法 IDSSL(Improved Disagreement-based Semi-Supervised Learning)。该方法以基于分歧的半监督方法为框架,首先利用Random Subspace的方式构建多个初始分类器,然后以"多数帮助少数"的方式利用无标记样本训练分类器。最后,在情感分析经典数据集上进行了实验,结果证明了本文提出的方法的有效性,而且取得了比其它半监督学习方法都好的实验结果。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社