作者:杨晔; 彭宏; 林嘉宜; 陈绍坚文本分类特征抽取kl距离正态分布贝叶斯概率
摘要:根据信息学理论和贝叶斯语义模型,提出一种有效特征词发现方法,利用该方法对训练文本的原始文本特征词集进行聚类,对测试文本进行分类计算和类别标注.闭式测试的结果表明,文本识别的正确率达到了90%以上,该算法对互联网信息处理有较好的应用价值.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《系统工程》(CN:43-1115/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《系统工程》是“国家自然科学基金委员会管理科学重要期刊”、始终坚持适应社会形势变化,加强杂志自身建设,进一步提高杂志的影响力和竞争力;坚持服务于国民经济建设主战场、服务作者和读者的思想;坚持严把质量关,不断提高杂志的档次,所有工作人员自觉维护杂志的声誉,提高发稿质量;坚持适应形势发展,不断推陈出新,推出新的栏目;坚持有一个团结一心、讲原则、高...
北大期刊、统计源期刊
人气 540871 评论 58
人气 226532 评论 63
省级期刊
人气 184158 评论 72
北大期刊
人气 160560 评论 69