HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于CNN-CRF的中文电子病历命名实体识别研究

作者:曹依依; 周应华; 申发海; 李智星实体识别中文电子病历卷积神经网路条件随机场

摘要:智慧医疗技术的发展让我们不满足仅使用传统方法做医学研究.针对中文电子病历实体识别问题,设计了一种基于卷积神经网络结合条件随机场(convolutional neural network-conditional random field,CNN-CRF)的实体识别算法框架.为得到高质量的词向量,将标注实体加入词典进行分词,并将已标注和未标注文本作为语料,用word2vec工具对已分词文本进行无监督学习;为避免扩张卷积层数增加导致过拟合,采用迭代扩张卷积处理输入向量,并使用dropout随机丢弃一些连接;运用条件随机场对网络的分类结果进行修正.把该方法在中文电子病历上进行对比试验,从病历中提取出身体部位,疾病,症状,检查及治疗5类实体.实验结果表明,该方法能有效地辨别病历中的实体,其识别的准确率、召回率和f1值分别为90.01%,90.62%,90.31%,准确率和速率比传统方法都有一定提高.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

重庆邮电大学学报·自然科学版

《重庆邮电大学学报·自然科学版》(CN:50-1181/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《重庆邮电大学学报·自然科学版》以信息学科为特色的专业性学术期刊;它反映了我国电子、通信、计算机、自动控制等最新科学技术研究成果,在中国文献领域占有重要的学术地位。

杂志详情