作者:刘建丽 刘椿年模式分类支持向量机回归分析基因分类
摘要:为了判断一个给定的DNA序列片段是基因序列还是间区序列,基于语言学方法提取了DNA序列特征,通过支持向量机(SVM)训练方法,实现了对人类22号染色体的DNA序列中的基因和基因间区序列的分类。在不依赖于任何生物领域知识的前提下,该方法能得到85%以上的分类精度。相对于SVM分类方法,虽然二元Logistic回归(BLR)方法也能达到较高的分类精度,但在训练时间上SVM方法远优于BLR方法。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社