作者:杨双浩网格计算高性能计算集群生物信息高通量测序
摘要:为解决基因测序数据量大、数据分析时间长,搭建FPGA、GPU计算平台成本高昂且计算软件兼容不足的问题,运用分布式计算思想设计高通量测序数据分析架构Sequence Grid(SeqGrid)。该架构安装centos开源操作系统,利用网格引擎Sun Grid Engine(SGE)、普通CPU、机械硬盘和SSD硬盘,通过并发调度生物信息软件bwa、GATK等实现数据分析。结果表明:单人全外显子组30GB数据分析时间从15h缩短至1h,计算速度达到串行流程的15倍,有效提高了数据分析效率。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社