作者:吴洁明; 赵文丽新闻出版标准碎片化自动标引词库
摘要:当前新闻出版行业对标准文献的标引工作都是采集标准的结构化信息进行标引,不对标准的具体内容部分标引,导致用户查询时无法快速定位到标准内容,为此提出针对标准的“碎片化”标引方案。根据标准的特点存储标准的结构及内容,建立新闻出版行业词库,以此为基础进行分词,采用统计加权算法,考虑词频、词性、词长、位置加权因子进行自动标引。实验结果表明,该方案实现了新闻出版行业标准的碎片化标引,提高了检索的效率和质量。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社