HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

用AdaBooster算法实现中文文本分类问题

作者:火善栋中文文本分类adabooster算法中文分词文档特征向量

摘要:文本分类是文本挖掘的一个重要内容,在很多方面都有着广泛的应用。为了实现中文文本分类问题,先采用分词技术和特征词统计相关方法得到每类训练文档的特征向量中心(质心),通过比较测试文档到质心的距离来实现中文文档分类,然后采用Ada Booster算法通过不断调整每类训练文档的质心构建一个强分类器。实验表明:采用Ada Booster算法进行中文文本分类时,算法简单、分类速度快、正确率高、占用内存小而且可以根据训练文档的不同实时地调整迭代次数。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

现代计算机

《现代计算机》(CN:44-1415/TP)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《现代计算机》是一本学科性、技术性较强的科技类学术期刊,作者读者群均面向计算机信息技术及应用研究开发设计生产的工程技术人员、大专院校师生及计算机爱好者。

杂志详情