0
400-888-7501
首页 期刊 数字图书馆论坛 政府公开信息自动标引的设计与实现【正文】

政府公开信息自动标引的设计与实现

作者:江华丽; 曹祺; 陈刚政府信息公开文本挖掘自动化标引

摘要:目前政府信息公开主要依据《中华人民共和国政府信息公开条例》,但站在用户视角,需要根据不同的使用场景进行适配,因此对公文进行自动化标引具有重要意义。本文基于自然语言处理技术,通过词频、词性和词义的实验和分析,提炼公文标题中的范式,对国务院1969—2018年的4388条公文进行自动化标引。其中以地域关键词和行业关键词为例进行标引,标引后提炼相关关键词可以供相关渠道进行搜索和二次加工。本文主要处理标题的标引,尚未对全文进行标引。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

数字图书馆论坛

《数字图书馆论坛》(CN:11-5359/G2)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《数字图书馆论坛》是我国唯一一本以“数字图书馆”命名的刊物,一直关注国内外数字图书馆领域的相关研究和实践,设有特别关注、专家访谈、专题研究、技术前沿、应用案例、业界动态等栏目,报道主题涵盖信息检索、数字资源、知识组织、语义技术、数据挖掘、开放获取、用户服务等,既关注数字图书馆领域的理论成果和创新实践,又反映国内外业界的新趋势、新发展和...

杂志详情