HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于Hadoop医学数据平台的数据清洗

作者:李杨; 刘洋; 贺瑞心; 张贵轩hadoop平台数据清洗hive数据仓库

摘要:随着医院信息化的不断深入和普及,病人的电子病历、药物信息、诊治记录和病人的个人信息等,存在着重复、不完整或错误的数据,无法在数据库中清晰明了地获取每个病人的信息,因此医学数据清洗应运而生。实现一个基于Kettle工具和Python语言的数据清洗平台。平台使用Kettle工具和Python语言对简单的医学重复数据、医学错误数据及医学不完整数据按照设计的清洗流程以及清洗规则进行清洗,之后通过Kettle转换存储到Hadoop平台的Hive数据仓库中,从而得到有价值的医疗数据并应用到医疗大数据分析和挖掘中。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电脑编程技巧与维护

《电脑编程技巧与维护》(CN:11-3411/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《电脑编程技巧与维护》一直秉承"实用第一,智慧密集"的办刊宗旨,定位与从事电脑编程,计算机系统应用,计算机系统软件研发和维护人群,坚持"质量第一,读者为本"的原则,"与时俱进,不断创新"的办刊理念,紧紧跟踪计算机技术、网络技术、信息技术发展和应用的脚步,培养和造就具有高超编程技能、系统应用研发与维护能力的专业人员是杂志一贯遵循的目标。

杂志详情