作者:刘鹏大数据分析电子病历spark机器学习频繁模式数据挖掘
摘要:医疗保险基金在社会稳定与人民健康生活水平提高中所承担的作用日益重要。基金审计所面对的是医疗机构几何级增长的“知识密集型”各类医学数据,传统的骗保行为甄别统计分析方法无法适用此类多样性与非结构化数据应用场景,必然导致探索以机器学习理论为基础的大数据分析方法的研究应用。围绕电子病历文本关联规则挖掘问题,探索利用Spark机器学习技术对关联规则挖掘算法在电子病历文本表达数据中的应用进行深入研究,在此基础上构建医疗保险欺诈行为审计系统的核心逻辑,用以深层次分析医疗机构和患者双维度挖掘效果。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社