文章介绍:
基于机器学习的方法——DislncRF,根据组织表达谱从全基因组范围预测疾病相关的lncRNA。DislncRF是基于随机森林模型训练已知的与疾病相关的蛋白编码基因(protein-coding genes ,PCGs),从而提取疾病与表达谱的一般模式,然后应用到lncRNA与疾病的关联中,
代码:https://github.com/xypan1232/DislncRF
figure
文章介绍:
基于机器学习的方法——DislncRF,根据组织表达谱从全基因组范围预测疾病相关的lncRNA。DislncRF是基于随机森林模型训练已知的与疾病相关的蛋白编码基因(protein-coding genes ,PCGs),从而提取疾病与表达谱的一般模式,然后应用到lncRNA与疾病的关联中,
代码:https://github.com/xypan1232/DislncRF
figure
文章介绍:
随着测序技术的发展,生命组学数据和医学数据爆炸式增长,单一组学指标并不能够充分反映疾病或正常的生命发育机制,结合多组学从不同层面揭示调控机制将有助于我们更精确的认识生命过程和疾病病因。这篇综述使用state-of-the-art techniques方法概括了调控网络重构的方法,为挖掘多组学数据(基因组、转录组、蛋白质组等)和其他生物数据背后的意义提供了参考。
figure
数据整合策略:
文章介绍:
RNAcentral是一个综合的非编码RNA数据库,包括大量物种所有类型的非编码RNA序列信息,同时整合了28个数据库,可以搜索比较不同数据库ncRNA序列信息,也可以与数据库比对检索序列与ncRNA序列的相似性,也可以通过Genome browser可视化ncRNA在基因组区域的注释信息,所有数据可以下载。
数据库网址:https://rnacentral.org
figure
文章介绍:
Bioconductor是一个针对生物数据分析的以R语言开发的开源软件库,从2001年项目开始至今,提供了很多优秀的分析流程,如bulk-RNA-seq的分析流程,文档非常详细。如今出手整理了单细胞分析的流程,包括软件安装、数据导入、单细胞数据储存、格式转换为下游分析的数据、下游分析、可视化等,非常详细,另外他们提供了在线book:https://osca.bioconductor .,想上手学习单细胞分析的以本书作为一个入门是一个不错的选择。
figure