作者:樊利; 林满山噪音数据信息熵模型mahout推荐算法
摘要:针对传统Mahout提供的推荐算法中的噪音数据问题,提出了用户信息熵模型.用户信息熵模型采用了信息论中信息熵的概念,利用信息熵的大小衡量用户信息的含量,利用用户评分数据得到用户的信息熵,过滤信息熵低的用户以及它们的相关数据,从而达到过滤噪音数据的目的.利用Mahout提供的推荐算法,即基于用户的协同过滤,基于物品的协同过滤以及Slope-One推荐算法对该模型进行验证.实验结果表明,该模型可有效过滤噪音数据,并在平均绝对误差上有了一定的降低.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社