单核苷酸多态性数据缺失值填补方法研究

作者：李昂温琪顾星博焦辛妮佟海龙袁重胜 ...数据模拟缺失值填补标签snp

摘要：目的通过对单核苷酸多态性（SNPs）数据展开缺失值填补影响因素与填补效果的研究,为利用SNPs数据进行基因与疾病的关联研究提供科学依据。方法以国际人类基因组单体型图计划（Hap Map计划）数据为原始数据,利用HAPGEN2软件,依据原始数据生成SNP基因型模拟数据,人为产生缺失数据并进行缺失值的填补,分析不同条件（4个水平的缺失比例、4个水平的参考数据样本量）的填补错误率。结果数据缺失比例越小、参考数据样本量越大,填补的错误率越低（样本量50、100、150和200的平均错误率分别为7.01%、5.92%、5.67%和5.26%）;2种缺失模式在缺失比例较大时（r^2=0.825）,随机缺失填补（平均5.64%）较固定缺失填补（平均9.10%）填补错误率低,而当缺失比例较小时（r^2=0.9）,固定位点缺失模式的填补错误率较低（平均4.96%）,在各种条件下IMPUTE2的填补错误率为3%~13%。结论缺失比例、参考数据样本量以及缺失模式对缺失数据填补的准确性有一定影响;对标签SNP数据进行缺失值填补,再进一步分析是一种有效的策略。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

中国公共卫生

《中国公共卫生》（CN：21-1234/R）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《中国公共卫生》杂志综合反映我国公共卫生与预防医学的业务进展与动态，推广学术研究成果，交流各级各类卫生预防保健机构的业务经验与技术方法。具有学术性、综合性、实用性，适合于卫生行政部门领导和管理人员作为业务参考，以全面掌握公共卫生与预防医学的学术进展与业务动态；是医学院校、研究机构、预防卫生保健单位、卫生监督单位、医疗机构的领导、专家和业务...

杂志详情

服务推荐

中国公共卫生相关期刊

单核苷酸多态性数据缺失值填补方法研究

服务推荐

在线咨询

杂志订阅

期刊推荐

中国误诊学

卫生职业教育

食品安全导刊

中国卫生产业