HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于时间线优化医疗海量小文件数据集成技术

作者:林德南 朱远燕 王浩 王爽 郑静医疗数据时间基线批量小文件数据集成技术

摘要:随着越来越多的医院开展数字化建设以及区域医疗应用范围的扩大,大量非结构化、半结构化医疗数据爆发式的增长,传统的技术架构在处理海量数据方面显得越来越乏力。深圳市区域卫生信息化数据交换平台,覆盖了全市60家公立医院、600多家社区卫生机构。平台接入近50个异构系统,现有1700多万份健康档案、30亿条以上诊疗数据,平均每天产生500万以上的小文件。针对深圳市卫生区域信息化建设,海量小文件交换处理效率低下的问题,利用Hadoop平台,提出了采用时间基线归档文件技术和序列文件技术解决小文件存储、检索效率问题的解决方案,经验证实该技术可满足实际业务应用中对数据交换的需要。详细描述了该技术的实现细节,包括根据业务数据规模划定时间基线,根据业务需求定制数据类型、数据结构,将小文件合并分块存储,建立小文件到大文件的映射以及相关数据交换处理流程等,并基于真实数据对该技术进行了评测比较,结果表明上述技术与常规技术相比明显提升了批量处理小文件的效率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国数字医学

《中国数字医学》(CN:11-5550/R)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《中国数字医学》以反映国内外数字医学发展动态,推动我国医疗卫生信息化快速发展为宗旨,以报道数字医学动态进展,传播数字医学理论方法,探究数字医学发展趋势,解读数字医学技术难题,展示数字医学科研成果,传递数字医学市场信息为优秀,向各级医疗卫生机构、医学高等院校、医学科研单位、IT企业与厂商等搭建学术交流平台。

杂志详情