作者:朱娴; 杨明; 马卫; 朱俊基因表达数据缺失数据填补模拟退火法双聚类
摘要:基因表达数据是由DNA微阵列实验产生的大规模矩阵,能有效地提取生物学信息,由于受到实验条件限制,基因表达数据往往存在缺失值,需要进行缺失数据的填补。传统的缺失数据填补方法是基于基因表达数据的单一特征,未充分考虑数据矩阵间的相关性。针对双聚类均方残值越小基因表达数据相关性越高这一特性进行研究,提出一种基于模拟退火优化双聚类的缺失数据填补方法(bi-SA),采用模拟退火法确定最优双聚类,从而实现缺失数据的最有效填补。四组真实基因表达数据实验表明,bi-SA方法能够获得较高的填补准确性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社