HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

支持向量机在基因核心启动子识别中的应用研究

作者:李宏彬; 赫光中; 吴晓明核心启动子支持向量机识别

摘要:核心启动子是DNA转录起始位上游一段可以与引发转录但又不被转录的关键序列。目前启动子预测已经有许多的研究,但预测的准确程度仍有待提高。支持向量机是主要用于分类的一种机器学习方法,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势。本研究采用支持向量机的机器学习方法,以多聚体词频统计和核酸序列正交编码两种特征提取方式,使用公共数据库提供的测试数据,对若干包括启动子和非启动子的大量核酸样本序列进行启动子识别和10折的交叉校验研究,发现核酸序列正交编码方式预测的准确率优于多聚体方式,而支持向量机的四种核函数中RBF核函数预测的准确性最高。研究还发现采用不同的序列长度(起始从-249到-100),预测准确度都接近,反映启动子与非启动子的核酸序列模式差异主要位于转录起始位上游-100到下游+50这段区间内,启动子序列中碱基G和C出现的频率显著性高于A和T,而非启动子正好相反。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

基因组学与应用生物学

《基因组学与应用生物学》(CN:45-1369/Q)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《基因组学与应用生物学》获全国优秀高校学校自然科学学报;教育部优秀科技期刊;广西优秀科技期刊;中国期刊方阵“双效”期刊。

杂志详情