用AdaBooster算法实现中文文本分类问题

作者：火善栋中文文本分类adabooster算法中文分词文档特征向量

摘要：文本分类是文本挖掘的一个重要内容,在很多方面都有着广泛的应用。为了实现中文文本分类问题,先采用分词技术和特征词统计相关方法得到每类训练文档的特征向量中心（质心）,通过比较测试文档到质心的距离来实现中文文档分类,然后采用Ada Booster算法通过不断调整每类训练文档的质心构建一个强分类器。实验表明：采用Ada Booster算法进行中文文本分类时,算法简单、分类速度快、正确率高、占用内存小而且可以根据训练文档的不同实时地调整迭代次数。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

现代计算机

《现代计算机》（CN：44-1415/TP）是一本有较高学术价值的大型半月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《现代计算机》是一本学科性、技术性较强的科技类学术期刊，作者读者群均面向计算机信息技术及应用研究开发设计生产的工程技术人员、大专院校师生及计算机爱好者。

杂志详情

服务推荐

现代计算机相关期刊

用AdaBooster算法实现中文文本分类问题

服务推荐

在线咨询

杂志订阅

期刊推荐

科技资讯

科技创新与应用

中小企业管理与科技

科技风