作者:罗宇辉; 侯汉清经济学数据挖掘未登录词因特网计算机辅助登录挖掘试验汉语自动分词
摘要:近年来随着社会经济科技和因特网的迅速发展,文献中不断涌现出大量未登录词.未登录词的存在严重影响了汉语自动分词与自动标引的准确率和速率.本文对1 000篇经济类网页的关键部位--关键词、摘要、题名、首段进行未登录词挖掘试验,侧重对未登录词挖掘步骤设计和处理方法的讨论.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《情报理论与实践》(CN:11-1762/G3)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
省级期刊
人气 279797 评论 74
人气 43343 评论 12
人气 28360 评论 10
CSSCI南大期刊、北大期刊、统计源期刊
人气 27422 评论 52