HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于XGBoost的搜索结果智能排序系统

作者:赵晗; 孟晓景; 张春勇xgboost特征缓存特征筛选并行预测

摘要:针对传统基于模型的搜索引擎排序及特征获取慢、非数值特征处理复杂等问题,提出一种基于XG⁃Boost的搜索结果智能排序模型。基于XGBoost算法构建排序模型,使用独热编码和Apriori算法对非数值特征进行处理和筛选,利用Redis对用户和商家特征数据进行缓存,通过并行预测的方式加快模型预测商家得分速度,最后利用XGBoost自带的模型评价函数对最终训练出来的模型进行评估,结果显示模型预测准确率为0.76,说明模型给符合用户偏好的商家打出了较高的分数。其中在训练集上的AUC为0.72,在测试集上的AUC为0.69,两者相差不大,表明模型没有出现明显的过拟合现象,而且准确率较高,可用于构建商家排序模型。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

软件导刊

《软件导刊》(CN:42-1671/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《软件导刊》是关于软件开发与管理的学术期刊,以服务于软件的提供者与应用者、增强产业发展能力为宗旨,及时向读者传递软件行业的主流技术、研究热点、企业管理理念和项目管理模式,准确反映行业动态与最新发展趋势,为政府和企业信息化提供服务;总结软件应用中的经验和问题,探讨软件管理与技术人才培养的教育模式,积极促进软件科技成果产业化,为软件行业提供技术...

杂志详情