作者:马宇洲; 陆世翔; 王喆tfidf协同过滤推荐模型
摘要:电视节目是陪伴人们从小到大的娱乐项目,以前在电视机前收看节目,随着科技的进步,大家现在纷纷用智能手机或者平板在APP上收看想看的节目,方便易得。与此同时,大数据也慢慢兴起,如何根据人们搜索记录和观看记录等信息去自动为人们匹配可能感兴趣或愿意收看的节目,也逐渐成为热门研究之一。本文中,我们利用python对附件一的数据进行异常值检测、去重等预处理。基于预处理的数据,初步对附件二中所给的数据与人们对各种类型的电视节目的感兴趣程度的相关性。根据已知数据中用户所观看的节目名字,利用python爬取到节目所属的一级类别,贴上一级标签,然后对爬取的电视节目信息进行切词,提取关键词并计算关键词的信息熵,排序贴上二级、三级、四级标签。对附件一经标签处理后的节目以及观看时长进行量化,建立用户的偏好模型,对用户的偏好进行打分排序,然后根据协同过滤推荐模型把产品推荐给用户,并计算出每一个产品的推荐指数,选取TOP20的推荐给用户。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社