作者:曾庆尚 武栓虎dna序列分析启动子预测词模式特征boosting
摘要:提出了一个新的启动子检测方法,它基于以下假设:启动子是由一些词模式决定的且不同的启动子由不同的词决定。通过计算散度距离选择最可能的特征并用feature-boosting构造一系列的弱分类器。一定数目的弱分类器可构造一强分类器,这样就可以达到一个较好的性能。和其他分类器不同的是,采用了不同的训练和分类策略。对大型基因序列实验结果和一些较好的算法比较显示该方法预测启动子区域是有效的,且具有较好的敏感性和特异性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社