HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

网络信息审计系统中的文本片断模糊分类算法

作者:李金库; 张德运; 高鹏; 孙钦东文本片段分类信息审计模糊分类

摘要:分析了分段对文本分类的影响,提出了与文本语义密切相关的最大语义标志原则(MSMR)和段落间的语义激励原则(SIR),在模糊K-最近邻分类算法的基础上,应用这2个原则设计并实现了一种基于上下文的文本片断模糊分类算法.该算法依据SIR判断文本片段分类的相互影响,降低了片段分类的错误率,当某一片断类隶属度大于某一阈值时,依据MSMR判定可知,同一文档的后续片断均属于同一类别,这样就不用计算所有片断的类隶属度.实验表明:与模糊K-最近邻分类算法相比,所提算法能有效提高系统的查准率、查全率和正确率,其中查全率可提高16%以上;在同一会话中,由于被明确分类后的后续片段不需要计算类隶属度,所以算法总计算时间明显少于模糊K-最近邻分类算法,具有较高的分类效率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

西安交通大学学报

《西安交通大学学报》(CN:61-1069/T)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《西安交通大学学报》主要刊登机械、电气、能源、动力、材料、电子、信息与控制、计算机、物理、力学、化学工程、生物工程、建筑工程以及有关新兴、交叉学科方面的最新研究成果。

杂志详情