HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于潜在语义索引和遗传算法的文本特征提取方法

作者:郝占刚; 王正欧特征提取潜在语义索引遗传算法kohonen网络

摘要:本文采用潜在语义索引(LSI)和遗传算法(GA)进行文本特征提取。在采用潜在语义索引将语义关系体现在VSM(Vector Space Model)中,通过奇异值分解(SVD,Singular Value Deccvaposition)可以有效地降低向量空间的维数,但通过维数约简后的文本特征仍要保持在数百维左右,因此本文采用遗传算法在此基础上继续降维。实验结果表明,这两种方法结合可以极大的降低文本向量空间的雏数,并能提高分类准确率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

情报科学

《情报科学》(月刊)创刊于1980年,由国家教育部主管,中国科学技术情报学会、吉林大学主办,CN刊号为:22-1264/G2,自创刊以来,颇受业界和广大读者的关注和好评。 《情报科学》内容涉及高校图书馆网络化建设、现代信息业发展、多媒体技术、情报人员结构等方面,本着求实创新的理念,始终站在学科研究的前沿,全面反映学科发展的动态,着力突出刊物与时俱进的时代特征,抓住图书情报界的研究热点,刊发了一大批既有理论水平,又有学术影响的重要论文,及时反映了情报学、信息管理、图书馆学等诸领域的最新研究进展。

杂志详情