作者:梅娟 何胜 王正祥 石贵阳 李炜疆蛋白质网络序列相似性远同源性模块性聚类蛋白质结构分类数据库
摘要:蛋白质的远同源性探测是结构基因组学和功能基因组学的主要研究任务之一。一些具有一定相似结构和功能、但序列相似性却较低的蛋白质组成蛋白质超家族,则远同源性探测问题等价于对蛋白质超家族的识别问题。作者提出了一种基于模块性的聚类算法ModuleFind,该方法通过最大化蛋白质网络的模块性来寻找具有较强集团结构的划分。在蛋白质结构分类数据库(SCOP)超家族层次上进行的实验表明,该方法得到的聚类结果更接近分类基准,且具有较高的F-测度值。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社