01|卷积神经网络突出了与结核分枝杆菌抗药性有关的突变
文章信息
题目:A convolutional neural network highlights mutations relevant to antimicrobial resistance in Mycobacterium tuberculosis
杂志:Nature Communications
IF: 17.69
时间:02 July 2022
链接:https://www.nature.com/articles/s41467-022-31236-0
摘要
漫长的诊断等待时间阻碍了国际社会为解决结核杆菌的抗生素耐药性所做的努力。病原体全基因组测序,再加上统计和机器学习模型,提供了一个有希望的解决方案。然而,由于缺乏可解释性,特别是在深度学习方法中,可推广性和临床采用受到限制。在这里,我们提出了两个深度卷积神经网络,预测结核杆菌分离物的抗生素耐药性表型:一个多药CNN(MD-CNN),根据18个基因组位点预测对13种抗生素的耐药性,AUC为82.6-99.5%,灵敏度高于最先进的方法;以及一组13个单药CNN(SD-CNN),AUC为80.1-97.1%,特异性高于以前的最先进方法。使用显著性方法评估输入序列特征对SD-CNN预测的贡献,我们确定了基因组中18个以前没有与抗药性相关的位点。CNN模型允许功能变异的发现、有生物学意义的解释和临床适用性。
抗性基因相关位点
MD-CNN的架构:
方法
- 首先根据已知的抗性基因筛选出变异位点,然后根据可能的调控序列,保留了变异位点相关的上下游序列。之后这些序列作为CNN模型的输入序列。采用逻辑回归作为基线模型。其实这篇文章的模型是常见的模型,没有独特和创新的点。
- 另一个可以学习的分析方法是显著性计算(Saliency calculation)。通过显著性计算预测到新的潜在的抗性相关的靶点。具体方法使用的是DeepLIFT v. 0.6.12.0。