HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于规则和机器学习的中文电子病历患者隐私保护算法

作者:王阳阳; 郑西川隐私保护电子病历命名实体正则表达式隐马尔科夫模型

摘要:目的针对医疗数据和共享中患者隐私泄露风险以及人工去标识效率低的问题,本文提出了一种基于规则和机器学习结合的算法,以有效去除电子病历中的患者隐私信息。方法根据美国健康可携行与责任性法案和中文电子病历的表达习惯,将隐私数据分为数字、日期及命名实体三大类,利用正则表达式识别数字以及日期隐私数据,引入隐马尔科夫模型识别命名实体。最后使用上海市第六人民医院的出院小结作为测试数据,利用留出法测试了隐私数据识别的召回率和精确率。结果该模型总体得到了超过90%的召回率,其中数字和日期类型的隐私数据召回率都超过96%,中文人名的识别效果也超过了单人识别的效果。结论规则和机器学习结合的模型有效地识别了患者的隐私数据,有助于医疗数据的共享。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

北京生物医学工程

《北京生物医学工程》(CN:11-2261/R)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《北京生物医学工程》主要刊登医学图像处理、生物医学信号检测与处理、生物医学信息与控制、生物材料、人工器官、生物力学、生物医学测量、中医工程、数字化医学中心、计算机在生物医学中的应用、医疗设备和器械等方面的理论研究与最新科技成果。设有论著、综述、研究简讯、临床应用、仪器维修等栏目,适合中高级从事生物医学工程的科研人员、工程人员、临床医...

杂志详情