作者:吴婷特征组合特征相关逻辑回归内容排序
摘要:逻辑回归因其模型简单和易解释性成为内容排序中常用算法,然而作为线性算法假设各个特征之间相互独立无关,这与实际场景中特征之间潜在关联性有异。分析发现特征之间潜在线性关联性并将这种关联性提取为新的特征,定义特征之间线性关联性存在正相关和负相关两种形态,定义特征之间相关系数达到设定阈值则认为构成相关特征。将组合后的特征与原有特征重新组合构成新的特征项,以逻辑回归算法对新特征项进行内容数据排序预测,实验结果表明,经过特征组合后特征项能够较为显著地提高模型预测AUC。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社