HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于K-means算法改进的短文本聚类研究与实现

作者:王俊丰; 贾晓霞; 李志强短文本聚类无监督

摘要:文中讨论在文本类目数未知的情况下,如何对数据量过少的短文本进行有效聚类的问题。短文本的特点是每一份样本文章数据少,数据稀疏,用常规的聚类方法进行文本聚类不能取得很好的效果。文中提出了一种基于K-means的改进算法,提出一种简单降维方式和新的判别样本点距离的方法,经实验验证,文中改进算法比原K-means算法有更高的准确性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

信息技术

《信息技术》(CN:23-1557/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《信息技术》的办刊宗旨是:大力宣传国家信息基础建设和信息产业发展形势,深入报导国内外信息技术(产品)发展趋势,交流信息化建设经验,推介信息产业界精英及其管理思想,提供信息技术(产品)市场前景与分析。

杂志详情