HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于概率分布的不确定数据聚类

作者:徐磊; 王隆杰; 彭干三; 任源梅; 陈洁标; ...不确定数据概率密度函数聚类

摘要:不确定性是数据的固有属性,在实验过程中由于仪器的限制或者收集过程中的误差都会造成数据的不确定性。数据挖掘算法在处理不确定数据的相关研究尚处于初级阶段,不确定数据聚类是不确定数据研究中的典型问题,已有一些聚类算法被应用到处理不确定数据,如UK-means等。无论是UK-means还是FDBSCAN都仅仅考虑了不确定数据之间的几何距离,而没有考虑到不确定数据之间的概率分布差异。然而,概率分布特征是不确定数据的本质特征,考虑不确定数据的概率分布能够更准确度量不确定数据间的距离,从而提高聚类算法的性能,本文使用核函数度量不确定数据与类中心的距离,然后使用UK-means算法聚类不确定数据,通过大量实验验证了本文提出的距离函数优于使用欧式距离期望的UK-means方法。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

深圳信息职业技术学院学报

《深圳信息职业技术学院学报》(CN:44-1586/Z)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《深圳信息职业技术学院学报》坚持四项基本原则,坚持“双为”和“双百”方针,倡导学术创新,主要刊发计算机软件、应用网络、电脑美术、通讯技术等信息技术类学科;会计电算化、电子金融等经济类学科;外语外贸、图书信息管理、现代教育技术等优质学术论文。

杂志详情