作者:张彦; 邵志清语义词典未登录词pat树语义距离
摘要:提出了一种基于PAT树型结构的高频字串提取的改进算法,并以此用来获得特定领域网页中的未登录词集合,利用基于语义距离的概念相似度计算公式来获得任一概念的相关概念,从而给出了用于特定领域搜索引擎的语义词典完整的自动构建方法.将生成的语义词典用于搜索引擎FlyingSender中.实验结果证明新的词典比原有的手工构建的词典分词效果要理想得多,而且提供了概念联想的功能.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《计算机工程》(CN:31-1289/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机工程》特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。
部级期刊
人气 229069 评论 65
人气 212552 评论 35
省级期刊
人气 211826 评论 71
北大期刊、统计源期刊
人气 192422 评论 73