作者:刘月程; 王焕军; 马金刚; 刘静; 魏德健; ...代谢组学数据预处理缺失值标准化
摘要:建立质谱代谢组学数据的预处理方法。采用K近邻法、连续K近邻法、多重插补法进行缺失值填补,应用正态、极差、均值、中位数、中心化、总强度标准化等方法进行数据预处理,以正态性检验、模型拟合能力、预测能力、分类效果对预处理方法进行评价。通过模型拟合能力、预测能力、分类效果检验评价,缺失值填补3种方法差别较小;直观分析确定多重插补法,正态性检验结果表明,经过缺失值插补后数据呈偏态分布;极差标准化后,数据呈现正态分布。6种标准化方法的评价结果显示,极差标准化后数学建模的拟合能力、预测能力和分类效果较好。应用多重插补缺失值填补–极差标准化法得到的质谱代谢组学数据可以进行数据模式识别。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社