HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于知识图谱扩展的短文本分类方法

作者:丁连红; 孙斌; 张宏伟短文本分类语义扩展知识图谱知识推理

摘要:概念图谱是微软根据对用户搜索日志的统计分析构建的一个大型知识图谱.为了解决文本分类中短文本的数据稀疏、易受噪声影响和主题不明确等问题,本文提出了一种基于概念图谱的短文本语义扩展表示方法.首先,计算文本特征词与概念图谱中各概念的关联度,选取关联度高的概念构成当前文本的概念词典.然后,将概念词典加入特征词集合得到短文本的语义扩展表示.对来自Twitter的短文本进行了扩展前与扩展后的分类实验,实验涉及5种分类算法和6种关联度计算方法.结果显示,概念化语义扩展表示可以提高短文本的分类效果,且包含可以扩展的特征越多的文本,分类结果提升越显著。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

情报工程

《情报工程》(CN:10-1263/G3)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《情报工程》目标:在为支持政府和企业在情报分析领域中的世间,提供情报分析的理论研究、技术方法、工程应用等方面的专业化学术交流平台。

杂志详情