HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于模拟样本训练的支持向量机

作者:张洪胜; 高海宾模拟样本支持向量机文本分类特征空间

摘要:在基于内容学习的文本分类中,人工标注的训练样本存在着数量有限、获取困难以及由普通文本转换为向量形式的学习样本时间较长等问题.针对此情况提出一种基于有限人工标注样本特征空间和TF-IDF权重计算的样本模拟生成算法.该算法先通过特征抽取获得类别的特征空间,然后利用TF-IDF公式计算特征的权重,再通过随机算法生成模拟样本,并将其用于支持向量机的文本分类中.实验结果表明,利用该算法生成的模拟训练样本训练得到的分类器,具有良好的分类效果,能极大地减少训练样本的生成时间.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

韶关学院学报

《韶关学院学报》(CN:44-1507/C)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《韶关学院学报》主要栏目有:政法研究、文学纵横、经济论坛、高校德育、旅游论丛、外语研究、学术动态、学人介绍等。

杂志详情