作者:王非微博新词发现新词过滤后缀树
摘要:微博作为社交网络的典型应用,每天都有新的富含情感的新词涌现,面向微博短文本的情感新词发现研究成为自然语言处理领域一个新的研究热点。本文提出了一种基于重复串统计的方法抽取候选词串,使用广义后缀树抽取所有可能的候选词串。然后利用本文提出的相关统计特征:候选词串的互信息与邻接信息熵等对候选词串进行筛选,实现新词过滤。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《软件》(CN:12-1151/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《软件》注重刊登反映计算机应用和软件技术开发应用方面的新理论、新方法、新技术以及创新应用的文章。
部级期刊
人气 214965 评论 35
北大期刊、统计源期刊
人气 129002 评论 48
人气 121447 评论 52
省级期刊
人气 104105 评论 58