HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于改进分词标注集的中文微博命名实体识别方法

作者:王超; 王峥微博分词标注命名实体神经网络条件随机场

摘要:近年来微博的快速发展使得非正式文本的命名体识别的研究受到越来越多的关注,同时微博的特点使命名体识别研究面临着诸多挑战。针对中文微博文本词汇新奇,不符合语法,且缺少明显的词边界等特点,结合目前应用广泛的LSTM(Long Short-term Memory)神经网络模型以及条件随机场模型分别用于中文分词任务和命名实体识别任务,用微博语料本身训练模型,然后改进分词标注集,为条件随机场模型提供更准确更多维的特征。在新浪微博数据上进行实验,结果表明本方法相比于通用分词软件和传统四词位分词集在准确率上提高了12%。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机与数字工程

《计算机与数字工程》(CN:42-1372/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机与数字工程》始终秉承:"坚持理论联系实际;坚持实事求是的学风;坚持以应用为主,提高与普及并重;坚持创新;坚持以刊登国内外计算机方面的新理论,新技术,新工艺,新成果研究为主;以学术性,技术性为办刊宗旨。

杂志详情