由于基因表达调控机制的复杂性,多种组学数据的整合分析,从不同的层面探究生物问题越来越重要。从RNA-Seq层面,我们可以探究哪些基因具有显著差异,上调或下调;从ChIP-Seq层面,我们可以研究某个特定转录因子的调控作用;从ATAC-Seq我们可以了解到染色质可及性的动态变化,由于染色质的可及性与调控元件或转录因子的结合密切相关,在转录调控中发挥着重要的作用。因此,整合分析可以进一步探究调控某一生物学过程的关键因子(包括顺式调控元件和转录因子),以及哪个转录因子调控了感兴趣的基因,以及感兴趣的转录因子的靶基因等。
目前,好像并没有标准化的方法用来整合比较这三种数据。不过在文献中可以看到有很多相同的或不同的思路和方法做整合分析,大家可以在学习交流群中推荐文献,一起解读学习。
第8篇:用网页版工具做功能分析和motif分析
上一篇介绍了使用ChIPseeker对peaks的分布和邻近基因的注释。除此之外,下游分析通常还包括鉴定我们感兴趣的蛋白质结合的motif;鉴定这些结合区域的基因以及这些基因的富集通路或网络。
学习目标
- 功能富集分析: [GREAT](http://bejerano.stanford.edu/great/public/html/index.php)
- motif分析:MEME套件,如DREME(http://meme-suite.org/tools/dreme), MEME-ChIP (http://meme-suite.org/tools/meme-chip)
第7篇:用Y叔的ChIPseeker对peaks进行注释和可视化
上一步骤(第6篇:重复样本的处理——IDR)用IDR对重复样本peaks的一致性进行了评估,同时得到了merge后的一致性的peaks——
sample-idr
,接下来就是对peaks的注释。这篇主要介绍用Y叔的R包ChIPseeker对peaks的位置(如peaks位置落在启动子、UTR、内含子等)以及peaks临近基因的注释。
ChIPseeker
ChIPseeker虽然最初是为了ChIP-seq注释而写的一个R包,但它不只局限于ChIP-seq,也可用于ATAC-Seq等其他富集peaks注释,也可用于lincRNA注释、DNA breakpoints的断点位置注释等所有genomic coordination的注释,另外提供了丰富的可视化功能。
ChIPseeker的强大功能请参考Y叔的ChIP-Seq系列文章),如:
CS3: peak注释
CS4:关于ChIPseq注释的几个问题
CS6: ChIPseeker的可视化方法(中秋节的视觉饕餮)