211012|文献摘要

Nat. Biotechnol. | 通过迁移学习将单细胞数据映射到参考图谱

题目:Mapping single-cell data to reference atlases by transfer learning

杂志:Nature Biotechnology

IF: 54.91

时间:30 August 2021

链接:https://www.nature.com/articles/s41587-021-01001-7

摘要

现在,大型单细胞图谱被不断地生成,作为分析较小规模研究的参考。然而,由于数据集之间的批次效应、计算资源的有限可用性和原始数据的共享限制,从参考数据中学习是复杂的。在这里,我们介绍了一种深度学习策略,用于在称为单细胞结构手术(single-cell architectural surgery,scArches)的参考之上映射查询数据集。scArches使用转移学习和参数优化来实现高效、分散、迭代的参考构建和新数据集与现有参考的上下文关系,而无需分享原始数据。利用小鼠大脑、胰腺、免疫和全生物体图谱的例子,我们表明scArches保留了生物状态信息,同时消除了批量效应,而且使用的参数比从头整合少四个数量级。最后,scArches在映射到健康参照物时保留了COVID-19的疾病变异,从而能够发现疾病特定的细胞状态。scArches将通过实现参照物图谱的迭代构建、更新、共享和有效使用来促进合作项目。

image-20211012210720260

Nat. Commu. | 深度迁移学习用于减少由于生物医学数据不平等引起的医疗保健差异

题目:Deep transfer learning for reducing health care disparities arising from biomedical data inequality

杂志:Nature Communication

IF: 14.92

时间:30 December 2020

链接:https://www.nature.com/articles/s41467-020-18918-3

摘要

随着人工智能(AI)越来越多地应用于生物医学研究和临床决策,开发对所有种族群体同样有效的无偏见的AI模型对预防和减少健康差异至关重要。然而,通过数据驱动的、基于算法的生物医学研究和临床决策,不同族裔群体之间的生物医学数据不平等将产生新的医疗保健差异。通过对癌症全向数据进行大量的机器学习实验,我们发现目前流行的多民族机器学习方案容易在不同民族之间产生明显的模型性能差异。我们表明,这些性能差异是由族群之间的数据不平等和数据分布差异造成的。我们还发现,转移学习可以改善处于数据劣势的民族群体的机器学习模型性能,从而为减少民族群体之间的数据不平等造成的医疗差异提供了有效的方法

image-20211012211618511

Nat. Commu. | 使用二维深度神经网络和迁移学习的组合预测RNA二级结构

题目:RNA secondary structure prediction using an ensemble of two-dimensional deep neural networks and transfer learning

杂志:Nature Communication

IF: 14.92

时间:27 November 2019

链接:https://www.nature.com/articles/s41467-019-13395-9

摘要

我们人类基因组的大部分转录为结构和功能未知的非编码RNA。获得非编码RNA的功能线索需要准确的碱基配对或二级结构预测。然而,目前基于折叠的算法对这种预测的表现已经停滞了十多年。在这里,我们提出使用深度上下文学习来预测碱基对,包括那些由三级相互作用稳定的非经典和非嵌套(假结)碱基对。由于只有<250个非冗余的、高分辨率的RNA结构可用于模型训练,我们利用转移学习,从一个最初用>10,000个非冗余RNA的最近高质量bpRNA数据集训练出来的模型。由此产生的方法在预测所有碱基对,特别是非经典碱基对和非嵌套碱基对方面取得了很大的、有统计学意义的改进。所提出的方法(SPOT-RNA),有免费的服务器和独立的软件,应该对改善RNA结构建模、序列比对和功能注释有帮助。

image-20211012212552824