在线留言

RNA-seq技术及数据分析

(1)介绍

RNA-seq即转录组测序技术,就是把mRNA、non-coding RNA等RNA(主要为mRNA)用高通量测序技术把它们的序列检测出来,用于分析样本内部基因的表达水平。其实验部分主要包含mRNA的样本制备和深度测序(Deep Sequencing)两个部分。

1)RNA提取的基本实验步骤

①总RNA的提取以及Ploy(A)+ RNA的筛选

②RNA片段打断和cDNA制备

③扩增后准备测序

RNA-seq实验示意图_RNA sequencing advances, challenges and opportunities.png

2)深度测序

当我们准备好片段化的DNA样本后,需要通过专业的高通量reads测序仪进行碱基读取步骤。之后把这些reads回贴到到参考染色体序列上或直接与转录组进行比对,通过每个基因外显子区域中reads含量多少计算基因的表达水平并展开其他后续的RNA-seq数据分析。

不同公司的测序原理_Application of 'next-generation' sequencing technologies to microbial genetics.png


(2)RNA-seq数据的生物信息学分析流程展示

RNA-seq数据的生物信息学分析步骤包括:测序饱和度估计、测序后reads的质控和筛选、clean reads比对、基因表达水平计算、样本组间差异表达基因的检测、癌症样本RNA-seq数据的研究分析、个性化下游分析。

img3

(3)应用领域

img4

(4)RNA-seq数据分析在医学研究中的应用

通过对RNA-seq数据进行系统化的生物信息学分析,我们能够获得如下结果:

1)观察疾病发生过程中病灶部位内部的转录组变化;

RNA-seq差异分析示例_Transcriptome Sequencing of Tumor Subpopulations Reveals a Spectrum of Therapeutic Options for Squamous Cell Lung Cancer.png


2)基于基因表达谱时序分析技术观察疾病发生过程中病灶部位转录组的连续变化过程,确定与疾病发生相关的基因类,该分析要求客户提供多个时间节点的数据;

RNA-seq时序分析示例_Studying and modelling dynamic biological processes using time-series gene expression data.png


3)通过专门算法的设计,RNA-seq数据能够帮助研究者在转录本层面上分析和预判基因可变剪接异常与疾病发生的关系;

4)在癌症研究中,使用RNA-seq技术可以预测潜在的融合基因,从而鉴定出那些蛋白功能结构域发生改变的基因,并提供给客户个性化的后续分析切入点;

RNA-seq融合基因检测示例_RNA sequencing advances, challenges and opportunities.png


5)使用RNA-seq技术检测基因外显子区域上的碱基突变位点,通过对密码子遗传变异的分析,研究剪辑突变对基因功能的影响以及与疾病的联系。

5)参考文献

1、Garber, M et al. Computational methods for transcriptome annotation and quantification using RNA-seq. Nature Methods (2011) Vol. 8 (6) pp. 469-477

2、Bar-Joseph, Z et al. Studying and modelling dynamic biological processes using time-series gene expression data. Nature Reviews Genetics (2011) Vol. 13 (8) pp. 552-564

3、Ozsolak, F et al. RNA sequencing: advances, challenges and opportunities. Nature Reviews Genetics (2011) Vol. 12 (2) pp. 87-98

4、Berger, B et al. Computational solutions for omics data. Nature Reviews Genetics (2012) Vol. 14 (5) pp. 333-346


生信分析