HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

多角度的特征提取方法

作者:方莹文本分类特征提取句法分析共现词组

摘要:以单个词语作为文本分类特征的传统方法会丢失词语的语义信息和必要的词语关系信息.在充分考虑词语的词频、语义信息和主要词语间依赖关系的基础上,提出了融合的多角度的特征提取方法.该方法利用词频和停用词表进行特征词的静态选择,基于知网利用语义信息进一步精简特征词,融入共现词组体现词语搭配关系并提高重要词语的分类作用.基于VSM的文本分类实验证明,该特征提取方法全面可行且能有效提升分类效果.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

轻工学报

《轻工学报》(CN:41-1437/TS)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《轻工学报》及时、准确报道我校和国内外科学技术成果,密切产、学、研,促使科技成果尽快转化为生产力,加速我国现代化步伐,以期达到本刊“传达科技信息,普及科技成果;发展科学技术,繁荣科技产业”的目的。

杂志详情