作者:陈佑雄 向阳 张骐 潘涛协同过滤neighborlshmapreduee
摘要:传统的近邻模型(k-nearestNeighborhood,KNN)是一种使用广泛的协同过滤模型,但是随着用户和项目的增加,需要计算大量用户或项之间的相似度,其时间复杂度过高.通过结合位置敏感哈希(Locality-SensitiveHas—hing,LSH)与MapReduce,提出了一种能够在线性时间复杂度内并行计算用户或项之间相似度的近邻模型推荐算法,降低了时间和空间复杂度.在TencentWeibo数据集上进行了仿真实验,实验表明提出的模型能有效解决传统近邻模型对于大数据集时间复杂度过高的问题,显著地提高了传统近邻模型的精度和降低传统近邻模型的耗时.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社