生信拾光


  • 首页

  • 标签

  • 分类

  • 归档

  • 搜索

第10篇:ATAC-Seq、ChIP-Seq、RNA-Seq整合分析

发表于 2019-08-23 | 分类于 Data Sciences |
字数统计: 876 | 阅读时长 ≈ 3

由于基因表达调控机制的复杂性,多种组学数据的整合分析,从不同的层面探究生物问题越来越重要。从RNA-Seq层面,我们可以探究哪些基因具有显著差异,上调或下调;从ChIP-Seq层面,我们可以研究某个特定转录因子的调控作用;从ATAC-Seq我们可以了解到染色质可及性的动态变化,由于染色质的可及性与调控元件或转录因子的结合密切相关,在转录调控中发挥着重要的作用。因此,整合分析可以进一步探究调控某一生物学过程的关键因子(包括顺式调控元件和转录因子),以及哪个转录因子调控了感兴趣的基因,以及感兴趣的转录因子的靶基因等。
目前,好像并没有标准化的方法用来整合比较这三种数据。不过在文献中可以看到有很多相同的或不同的思路和方法做整合分析,大家可以在学习交流群中推荐文献,一起解读学习。

阅读全文 »

第9篇:差异peaks分析——DiffBind

发表于 2019-08-23 | 分类于 Data Sciences |
字数统计: 1.1k | 阅读时长 ≈ 4

学习目标

  • 学习用DiffBind流程评估两个样本间的差异结合区域

  • 用PCA评估样本间的关系

  • 评估不同工具得到的差异peaks的一致性

阅读全文 »

第8篇:用网页版工具做功能分析和motif分析

发表于 2019-08-23 | 分类于 Data Sciences |
字数统计: 973 | 阅读时长 ≈ 3

上一篇介绍了使用ChIPseeker对peaks的分布和邻近基因的注释。除此之外,下游分析通常还包括鉴定我们感兴趣的蛋白质结合的motif;鉴定这些结合区域的基因以及这些基因的富集通路或网络。

学习目标

  • 功能富集分析: [GREAT](http://bejerano.stanford.edu/great/public/html/index.php)
  • motif分析:MEME套件,如DREME(http://meme-suite.org/tools/dreme), MEME-ChIP (http://meme-suite.org/tools/meme-chip)
阅读全文 »

第7篇:用Y叔的ChIPseeker对peaks进行注释和可视化

发表于 2019-08-23 | 分类于 Data Sciences |
字数统计: 1.1k | 阅读时长 ≈ 4

上一步骤(第6篇:重复样本的处理——IDR)用IDR对重复样本peaks的一致性进行了评估,同时得到了merge后的一致性的peaks——sample-idr,接下来就是对peaks的注释。这篇主要介绍用Y叔的R包ChIPseeker对peaks的位置(如peaks位置落在启动子、UTR、内含子等)以及peaks临近基因的注释。

ChIPseeker

ChIPseeker虽然最初是为了ChIP-seq注释而写的一个R包,但它不只局限于ChIP-seq,也可用于ATAC-Seq等其他富集peaks注释,也可用于lincRNA注释、DNA breakpoints的断点位置注释等所有genomic coordination的注释,另外提供了丰富的可视化功能。
ChIPseeker的强大功能请参考Y叔的ChIP-Seq系列文章),如:
CS3: peak注释
CS4:关于ChIPseq注释的几个问题
CS6: ChIPseeker的可视化方法(中秋节的视觉饕餮)

阅读全文 »

第6篇:重复样本的处理——IDR

发表于 2019-08-23 | 分类于 Data Sciences |
字数统计: 1.2k | 阅读时长 ≈ 5

前言

ATAC-seq/ChIP-Seq中重复样本的处理

ATAC-Seq要求必须有2次或更多次生物学重复(十分珍贵或者稀有样本除外,但必须做至少2次技术重复)。理论上重复样本的peaks应该有高度的一致性,实际情况并不完全与预期一致。如何评价重复样本的重复性的好坏?如何得到一致性的peaks?

这一节将介绍两种方法:

1. 用Bedtools进行简单的overlap合并重复样本
2. 用IDR(Irreproducibility Discovery Rate)的方法获得高重复性的peaks

阅读全文 »
1…242526

六六

Seize the day! Collect the moment! Share the memory!

130 日志
5 分类
52 标签
RSS
0%
© 2023 六六 | Site words total count: 87.3k
博客全站共87.3k字