HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于弱监督的蛋白质交互识别

作者:彭昀磊; 牛耘蛋白质交互弱监督聚类模式

摘要:蛋白质交互信息是解决大量医学难题的关键信息,这些信息都记录在医学文献中,随着生物医学文献的大量增加,以手工收集信息的方式已经难以满足实际需求.对此,提出一种基于弱监督的方法识别文本中的蛋白质交互关系.该方法首先根据文本库产生蛋白质交互的向量表示;接着根据蛋白质对实例的相似性对实例聚类,产生提取模式;然后根据提取模式从文本库中找到新的满足条件的蛋白质对实例,作为候选实例;最后对候选实例对应的蛋白质对进行评估,并将满足条件的蛋白质对添加到种子集合中.该方法仅需少量的蛋白质对作为种子,通过迭代算法不断扩充种子集,可以使得监督最小化,极大地减少了人工干预.实验结果表明,该方法取得了较高的精度和召回率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机技术与发展

《计算机技术与发展》(CN:61-1450/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机技术与发展》在国内外有广泛的覆盖面,国内读者遍布全国32个省(市、自治区)以及港、澳、台地区,境外读者分布在北美、西欧、韩国、日本等38个国家和地区。

杂志详情