作者:王东基因表达谱支持向量机特征子集分类准确率
摘要:癌症仍然是现在最困扰人类的疾病之一。得益于基因芯片技术的发展,研究人员获得了大量的癌症基因表达谱数据,生物医学中的基因分析就是对基因表达谱数据进行分析,基因表达谱具有高维小样本的性质,这种特性使得疾病诊断和基因分析的过程面临极大的挑战。针对基因表达谱的基本特性,文章提出了一种新的特征选择方法—显著性假设检验方法。该方法通过逐个计算各组数据与其余组数据之间的显著性分数,然后分别与设定好的显著性分数进行对比,若都大于预先设定的显著性分数,则表明该组数据对癌症的分类是重要的,并将其保留。实验采用支持向量机对基因表达样本进行分类,结果表明,该算法运行速度较快,得到的特征子集的维数较小,并且分类器在该算法得到的子集上具有较高的分类准确率。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社