生信拾光


  • 首页

  • 标签

  • 分类

  • 归档

  • 搜索

211011-|文献摘要

发表于 2021-10-11 | 分类于 literature |
字数统计: 423 | 阅读时长 ≈ 1

Brief. Bioinformatics | DeepHost:用卷积神经网络进行噬菌体宿主预测

题目:DeepHost: phage host prediction with convolutional neural network

杂志:Briefings in Bioinformatics

IF: 11.62

时间:22 September 2021

链接:https://doi.org/10.1093/bib/bbab385

摘要

新一代测序技术迅速扩大了已知的噬菌体基因组。与基于培养的方法不同,从下一代测序数据中发现的噬菌体的宿主仍未被描述。噬菌体基因组的高度多样性使得宿主分配任务具有挑战性。为了解决这个问题,我们提出了一个噬菌体宿主预测工具-DeepHost。为了将噬菌体基因组编码成矩阵,我们设计了一种基因组编码方法,应用各种间隔的K-mer对来容忍序列变化,包括插入、删除和突变。DeepHost应用卷积神经网络来预测宿主分类法。DeepHost在属级(72个分类群)的预测准确率为96.05%,在种级(118个分类群)的预测准确率为90.78%,比现有的噬菌体宿主预测工具高出10.16-30.48%,取得了与BLAST相当的结果。对于在BLAST中没有命中的基因组,DeepHost在属级获得了38.00%的准确率,在种级获得了26.47%的准确率,使其适用于与现有数据集同源序列较少的基因组。DeepHost是alignment-free的,它比BLAST快,特别是对大的数据集。DeepHost可在https://github.com/deepomicslab/DeepHost。

文章思路

image-20211011221810475

基因组序列编码方法:

image-20211011221515028

Illustration of the matrix construction process. Given a DNA sequence, all possible 2-mer pairs are collected with spaced distance of 0 (upper) and 1 (lower). For each distance, we construct two matrices.

CNN 架构

image-20211011221657856

210930 |文献摘要

发表于 2021-09-30 | 分类于 literature |
字数统计: 362 | 阅读时长 ≈ 1

Brief. Bioinformatics |评估基于基因组测序数据寻找顺式调控基序的深度学习方法

题目:Assessing deep learning methods in cis-regulatory motif finding based on genomic sequencing data

杂志:Briefings in Bioinformatics

IF: 11.62

时间:05 October 2021

链接:https://doi.org/10.1093/bib/bbab374

摘要

从基因组测序数据(如ChIP-seq和CLIP-seq)中识别顺式调控基序,对于识别转录因子(TF)结合位点和推断任何生物体的基因调控机制至关重要。自2015年以来,深度学习(DL)方法已被广泛用于识别TF结合位点和预测基序,其优点是提供一个可扩展的、灵活的和统一的计算方法,以实现高度准确的预测。目前已经开发了20种DL方法。然而,如果没有一个明确和系统的评估,用户将很难为他们的具体研究选择最合适的工具。在这份研究中,他们使用690个ENCODE ChIP-seq、126个癌症ChIP-seq和55个RNA CLIP-seq数据评估了20种顺式调控图案预测的DL方法。他们评估了四个指标,包括发现动机的准确性、DNA/RNA序列分类的性能、算法的可扩展性和工具的可用性。评估结果证明了现有DL方法的高度互补性。确定最适合的模型应主要取决于数据的大小和类型以及方法的输出。

image-20211011215253621

image-20211011215337568

210929 |文献摘要

发表于 2021-09-29 | 分类于 literature |
字数统计: 1.6k | 阅读时长 ≈ 5

Commun. Biol. | Review | 人工智能加速抗生素发现

题目:Accelerating antibiotic discovery through artificial intelligence

杂志:Communication Biology

IF: 6.268

时间:09 September 2021

链接:https://doi.org/10.1038/s42003-021-02586-0

摘要

通过靶向结合入侵的生物体,抗生素将自己插入宿主-病原体进化军备竞赛的古老斗争中。随着病原体进化出躲避抗生素的策略,治疗的疗效也逐渐下降,而且必须被取代,这使抗生素与大多数其他形式的药物开发不同。再加上缓慢而昂贵的抗生素开发管道,耐药性病原体的扩散促使人们对有望加快候选药物发现的计算方法产生迫切的兴趣。人工智能(AI)的不断发展鼓励其应用于计算机辅助药物设计的多个层面,并越来越多地应用于抗生素发现。

这篇综述描述了
1)人工智能在发现小分子抗生素和抗菌肽方面的进展。
2)除了对抗菌活性的基本预测外,还强调了抗菌化合物的代表性、药物相似性特征的确定、抗菌剂的抗性和新分子设计。
3)分析了人工智能驱动的抗生素发现中对开放科学最佳实践的吸收情况,并主张将开放性和可重复性作为加速临床前研究的手段。
4)最后,讨论了文献中的趋势和未来探索的领域。

抗生素发现的相关数据库

image-20210929133826090

计算方法发现抗生素的流程

image-20210929125714699

阅读全文 »

整合多组学数据和图像卷积网络鉴定新的癌症基因和相关的分子机制

发表于 2021-09-19 | 分类于 literature |
字数统计: 106 | 阅读时长 ≈ 1

文章信息

题目:Integration of multiomics data with graph convolutional networks to identify new cancer genes and their associated molecular mechanisms

杂志:Nature Machine Intelligence

IF:16.65

时间:12 April 2021

链接:https://www.nature.com/articles/s42256-021-00325-y

一句话评价

使用机器学习方法——图像卷积网络对多组学数据(SNPs, CNV,DAN methylation,protein interaction (PPI) networks)进行挖掘,预测新的癌症基因以及这些基因发挥功能的机制。

image-20210919224314468

image-20210919224447370

多标签分类提高耐药性预测能力

发表于 2021-04-04 | 分类于 literature |
字数统计: 115 | 阅读时长 ≈ 1

文章信息

题目:Exploiting HIV-1 protease and reverse transcriptase cross-resistance information for improved drug resistance prediction by means of multi-label classification

杂志:BioData Mining

IF: 2.672

时间:2016

链接:DOI 10.1186/s13040-016-0089-1

一句话评价

多标签分类应用

阅读全文 »
1…345…26

六六

Seize the day! Collect the moment! Share the memory!

130 日志
5 分类
52 标签
RSS
0%
© 2023 六六 | Site words total count: 87.3k
博客全站共87.3k字