作者:邱运芬; 张晖; 李波; 杨春明; 赵旭剑地理位置人群分类分层狄利克雷过程潜在狄利克雷分布亲和力聚类
摘要:地理位置作为用户生活轨迹的具体表现,在人群分类中有着举足轻重的作用。地理位置数据具有高维稀疏性,已有人群分类方法需对位置数据进行特征选择并提前确定特征数,实际应用中存在不便。针对该问题,提出基于地理位置人群分类的一种非参数聚类方法。该方法首先利用分层狄利克雷过程(Hierarchical Dirichlet Process,HDP)无监督学习出最佳特征个数;然后利用潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)对位置数据进行特征选取,同时得到功能特征概率矩阵;最后将其作为聚类权向量计算用户间的相似度,利用亲和力聚类(Affinity Propagation,AP)实现人群分类。实验结果表明,该方法较传统方法消耗时间更少、占用内存更低,且同时具有较高的F-measure。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社