HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于多元关系融合的科技文本主题识别方法研究

作者:许海云; 武华维; 罗瑞; 董坤; 李婧文本主题识别多元关系数据融合关系融合主题聚类

摘要:当前文本主题获取方法大多依靠单一关联分析,不能全面分析可获取信息,难以准确获取科技发展主题。科技文献的主题词、作者和引文之间蕴含了以研究主题内容为纽带的语义关联关系,主题词共现关系、引文关系和合著关系分别从不同的角度展现了主题关联关系。因此,本文根据主题词之间语义关系距离的远近,将主题识别中主题词关联分为基础关系、强化关系和新增关系,在此基础上提出面向主题识别的多元关系抽取及关系融合方法;并以基因工程疫苗的研发与制备领域为例进行领域实证分析,利用PathSelClus算法实现基于多元关系融合的主题聚类,通过对比实验证明多元关系融合可以有效提高实证领域的文本主题聚类效果,而未来多关系融合主题识别则是需要重点关注的问题。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国图书馆学报

《中国图书馆学报》(双月刊)创刊于1957年,由中华人民共和国文化和旅游部主管,中国图书馆学会;国家图书馆主办,CN刊号为:11-2746/G2,自创刊以来,颇受业界和广大读者的关注和好评。

杂志详情