生信拾光


  • 首页

  • 标签

  • 分类

  • 归档

  • 搜索

lncRNA的保守和不保守

发表于 2020-05-13 |
字数统计: 424 | 阅读时长 ≈ 1

文章信息

题目:Distinct Processing of lncRNAs Contributes to Non-conserved Functions in Stem Cells

杂志:Cell

时间:6 April 2020

链接: https://doi.org/10.1016/j.cell.2020.03.006

该文章的评论文章:

题目:The Secret Life of lncRNAs: Conserved, yet Not Conserved

链接:https://doi.org/10.1016/j.cell.2020.04.012

文章介绍

长非编码RNA(lncRNAs)的进化速度比mRNAs更快。保守的lncRNAs是否经过保守的加工、定位和功能仍未被探索。中科院陈玲玲教授团队报告了人类(h) 和小鼠 (m) 胚胎干细胞(ESCs)中不同的lncRNAs的亚细胞定位。与mESCs相比,在hESCs的细胞质中定位的lncRNAs的比例明显高于mESCs。事实证明,这对hESC的多能性很重要。FAST是一种位置保守的lncRNA,但在加工和定位方面并不保守。在hESCs中,细胞质定位的h FAST与E3泛素连接酶β-TrCP的WD40域结合,并阻止其与磷酸化的β-catenin相互作用,以防止降解,导致激活WNT信号转导,这是多能性所需的。与此相反,m Fast在mESCs中被核保留,其处理被拼接因子PPIE抑制,而PPIE在mESCs中高表达,但在hESCs中没有。这些发现揭示了lncRNA的加工和定位是之前未被重视的作用于快速进化的贡献者。

阅读全文 »

利用机器学习模型从全基因组序列中预测胸膜肺炎放线菌抗药性

发表于 2020-05-13 |
字数统计: 638 | 阅读时长 ≈ 2

文章信息

题目:Evaluation of Machine Learning Models for Predicting Antimicrobial Resistance of Actinobacillus pleuropneumoniae From Whole Genome Sequences

杂志:Frontiers in Microbiology

时间:06 February 2020

链接: https://doi.org/10.3389/fmicb.2020.00048

2020-05-07_fig2.png

文章概述

抗生素耐药性(AMR)正在成为世界各国面临的一个巨大公共安全问题,识别对某些抗生素耐药或易感菌株的新方法对于对抗抗生素耐药病原体至关重要。由于基因组数据集和AST表型越来越多,基于基因型的机器学习方法作为一种诊断工具显示出了巨大的希望。

本文采用支持向量机( Support Vector Machine,SVM)和集覆盖机(**Set Covering Machine,SCM)模型来学习和预测五种药物(四环素类、氨苄西林、磺胺恶唑、曲美沙星和恩诺沙星)的耐药性。SVM模型利用分离菌的基因组与参比基因之间共存的k-mers的数量来学习和预测细菌对特定抗生素的表型,而单片机模型则采用贪婪的方法构造布尔函数的联结或解联,找到最简洁的k-mers集,从而准确预测表型。对SVM和SCM模型的训练集进行五倍交叉验证,选择最佳的超参数值,以避免模型过度拟合。结果表明,无论哪种药物的耐药机制是获得性耐药还是染色体点突变,5种药物的SVM和SCM模型的训练准确率(平均交叉验证得分)和测试准确率均在90%以上。5种药物的表型与模型预测的相关性结果表明,SVM和SCM模型均能显著地将耐药分离菌从敏感分离菌中分离出来(P<0.01),可作为抗生素耐药性监测和兽药临床诊断的潜在工具。

阅读全文 »

使用随机子空间集合的机器学习从三种病原体的泛基因组中识别出抗生素耐药性决定因素

发表于 2020-05-13 | 分类于 literature |
字数统计: 834 | 阅读时长 ≈ 2

文章信息

题目:Machine learning with random subspace ensembles identifies antimicrobial resistance determinants from pan-genomes of three pathogens

杂志:PLOS COMPUTATIONAL BIOLOGY

时间:March 2, 2020

链接: https://doi.org/10.1371/journal.pcbi.1007608

2020-05-07_fig1.png

文章概述

抗菌剂耐药性的演变对全球公共卫生构成了持续的威胁。 测序工作已经获得了数千种耐药微生物分离物的基因组序列,需要强大的计算工具来系统地阐明AMR的遗传基础。

在这里,文章提出了一种可通用的机器学习工作流程,基于构建的参考菌株诊断泛基因组和训练随机子空间集合(RSEs),用于鉴定驱动AMR的遗传特征。这一工作流程对三种病原体的14种抗菌素的耐药性谱进行了研究,其中包括288种金黄色葡萄球菌、456种绿脓杆菌和1588种大肠杆菌基因组。文章发现,与常见的统计学检验和以前的集合方法相比,他们发现通过特征选择法检测已知的AMR更可靠,利用该方法共识别出45个已知的AMR基因和等位基因,以及25个由域级注释支持的候选关联。此外,发现来自于RSE方法的结果与现有的氟喹诺酮(FQ) 的理解是一致的。(FQ)抗药性是由于这三种生物体中主要药物靶点gyrA和parC的突变引起的,并表明这些基因在FQ抗药性方面的突变情况是简单的。随着更大的数据集的出现,我们希望这种方法能够更可靠地预测更多微生物病原体的AMR决定因素。

阅读全文 »

利用深度学习从宏基因组数据中预测抗生素抗性基因—DeepARG(方法详解)

发表于 2020-05-06 |
字数统计: 316 | 阅读时长 ≈ 1

​ image.png

方法概述:

从CARD,ARDB和UNIPROT 3个数据库分别提取抗性基因(antibiotic resistance genes,ARGs), 3个数据库分别提取到2161,2290和28108个抗性基因。然后对3个数据库的抗性基因进行注释和分类,CARD和ARDB共鉴定到102个抗生素,包括30个抗生素分类。UNIPROT通过文本挖掘注释,然年再结合CARD和ARDB两个数据库验证。

得到经过前处理后的数据,利用深度神经网络训练模型,凭借Python中的Theano库的Lasagne模块实现模型训练。分别对短读长序列和长基因序列分开训练,得到deepARG-SS 和 deepARG-LS。

评估模型通过两个方法:一是UNIPROT的70%数据作为训练数据,30%作为测试验证数据;二是借助MEGARes数据库的数据作为独立的验证数据集,评估模型的表现。

阅读全文 »

卷积神经网络入门

发表于 2020-05-04 |
字数统计: 2.4k | 阅读时长 ≈ 10

卷积神经网络(CNN)简介

卷积神经网络即Convolutional Neural Networks (CNN or COnvNet) 是一种自动化提取特征的深度学习模型。这是一种深度的前馈人工神经网络( feed-forward artificial neural network),前馈神经网络也称作多层感知机(multi-layer perceptrons,MLPs)。

CNNs是受生物视觉皮层的启发。视觉皮层有一些小区域的细胞,它们对视野的特定区域很敏感。这个想法是由Hubel和Wiesel在1962年做的一个的实验扩展了这个想法。在这个实验中,研究人员表明,大脑中的一些个别神经元只有在出现垂直或水平边缘等特定方向的边缘时才会激活或发射。但是在2012年,Alex Krizhevsky利用卷积神经网络赢得了当年的ImageNet大赛,将分类误差从26%降到15%,之后CNNs再一次火爆。

CNNs如今在多个领域都展现出巨大的应用潜能。如:

  • 图像识别,目标检测,分割,人脸识别
  • 自动驾驶汽车等
阅读全文 »
1…91011…26

六六

Seize the day! Collect the moment! Share the memory!

130 日志
5 分类
52 标签
RSS
0%
© 2023 六六 | Site words total count: 87.3k
博客全站共87.3k字