作者:唐伟 刘丰年 陈崇帮 欧新良 王苏文本分类基尼指数测度函数纯度原理
摘要:随着网上信息的极大丰富,文本分类技术显得越发重要,且预处理技术已成为文本分类的瓶颈.在预处理中采用TF-IDF算法,并且根据基尼指数的纯度原理对传统的基尼指数方法进行了基尼指数测度函数的改进,以降低原始文本的特征选择空间的维数.通过对比实验数据,表明这种改进是可行且有效的,体现在时间、空间复杂度小,精确度高.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《长沙大学学报》(CN:43-1276/G4)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《长沙大学学报》严格遵循正确的办刊宗旨和方向,积极探索学术期刊的办刊规律,始终把社会效益放在首位,突显学报的学术性、科学性、创新性,加入中国学术期刊光盘版和中国学术期刊网后,学报的影响日益扩大,所发文章的摘转率日益提高。
部级期刊
人气 71910 评论 50
人气 55870 评论 65
北大期刊、CSCD期刊、统计源期刊
人气 39199 评论 47
CSSCI南大期刊、北大期刊
人气 38592 评论 63