作者:冀燃; 李冬果; 张大保基因关联研究元分析数据定位数据提取单核苷酸多态性
摘要:随着自然语言分析、文本挖掘等技术高速发展,元分析中数据提取工作逐渐从人工手动提取向计算机自动提取转变。本文以基因关联研究(Genome-WideAssociationStudy,GWAS)研究为例,通过预先对纳入研究中感兴趣的数据元素进行定位并明确注意事项,来制定元分析的数据自动提取策略方案,使计算机通过搜索少量文献即可快速准确地提取完整的研究数据。以阿尔兹海默疾病的GWAS研究的元分析为例,将纳入的研究按照上文提出的方法进行搜索并提取数据。结果显示,本研究有效缩短了搜索、提取数据的时间,同时提取数据的成功率和准确度可以保持在90%以上。本文为GWAS研究自动提取数据提供了一种有效的策略和向导作用,对于元分析向大数据时展有着推进作用。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社