HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于指数分布族的类特定文本分类算法

作者:刘云; 黄荣乘指数分布族类特定特征选择类条件概率密度函数多项式朴素贝叶斯分类器文本分类

摘要:在文本分类中,选取一个高效的分类算法是提高文本分类准确度,缩短分类时间的关键。提出基于指数分布族的多项式贝叶斯类特定分类算法(exponential family-multinomial naive Bayes,EF-MNB),基于多项式模型构造了 N 个类的分布,利用类特定特征选择算法得到第 N 个类的特征子集及对应类的特征概率密度函数(probability density function,PDF),通过指数分布族构造了 N 个类的原始PDF估计表达式,给定 N 个类的训练集,得到了第 N 个类的最优PDF估计,并基于贝叶斯定理制定了分类规则。仿真结果表明,与基于文档主题生成模型和支持向量机(latent dirichlet allocation-support vector machine,LDA-SVM)的层次分析分类算法、改进的超球支持向量机(improved hyper-sphere support vector machine,IHS-SVM)文本分类算法和基于主成份分析和k最近邻(principal component analysis-k-nearest-neighbor,PCA-KNN)混合分类算法相比,EF-MNB类特定分类算法使用少量的时间就可获得更高分类准确率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

重庆邮电大学学报·自然科学版

《重庆邮电大学学报·自然科学版》(CN:50-1181/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《重庆邮电大学学报·自然科学版》以信息学科为特色的专业性学术期刊;它反映了我国电子、通信、计算机、自动控制等最新科学技术研究成果,在中国文献领域占有重要的学术地位。

杂志详情