HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

改进的协同过滤算法及其并行化实现

作者:李嵩; 李书琴; 刘斌协同过滤类别加权度用户聚类spark平台并行化

摘要:为解决海量数据背景下推荐系统的可扩展性问题和评分空间上的数据稀疏性问题,研究Spark平台下基于格拉斯曼秩1更新子空间估计法(GROUSE)和用户聚类的改进协同过滤推荐算法(CF-GUC)。通过改造GROUSE算法对评分矩阵进行填充;构造用户项目类别矩阵,对用户进行模糊聚类;引入类别加权度,对评分进行加权修正,在此基础上应用协同过滤算法进行预测评分;将改进算法在Spark计算平台上做并行化实现。实验结果表明,当最近邻居数 k 取30到40时,CF-GUC算法相比于CF-mean算法、CF-UC算法、Pearson-CF算法,MAE值分别降低了约3.31%、3.02%、6.48%,在3种不同规模的数据集下基于Spark平台的CF-GUC算法运算效率比单节点提高了约40%到60%。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与设计

《计算机工程与设计》(CN:11-1775/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情