在线留言

ChIP-seq技术及数据分析

(1)简介

ChIP-seq技术是一种以研究蛋白质与染色体DNA的相互作用为主要目的的高通量数据分析手段,其实验部分主要包含染色质免疫共沉淀(ChIP)样本制备和深度测序(Deep Sequencing)两个部分。

1)ChIP实验基本步骤

①甲醛交联整个细胞系(组织),即将目标蛋白与染色质连结起来;

②分离基因组DNA,并用超声波将其打断成一定长度的小片段;

③添加特异性识别目标蛋白质的抗体,该抗体与目标蛋白形成免疫沉淀免疫结合复合体;

④去交联,纯化DNA即得到染色质免疫沉淀的DNA样本,准备测序。

ChIP-seq实验示意图_ChIP-seq and beyond new and improved methodologies to detect and characterize protein-DNA interactions.png


2)深度测序

当我们准备好片段化的DNA样本后,需要通过专业的高通量reads测序仪进行碱基读取的步骤。之后把这些reads回贴到参考染色体序列上从而间接确定蛋白因子在染色体上的位置分布以及每个结合位点上蛋白因子的结合强度。

不同公司的测序原理_Application of 'next-generation' sequencing technologies to microbial genetics.png


(2)ChIP-seq数据的生物信息学分析流程展示

ChIP-seq数据的生物信息学分析步骤包括:测序饱和度估计、测序后reads的质控和筛选、clean reads比对、蛋白因子结合位点检测、结合位点周围候选靶基因注释、样本组间数据比较和差异结合位点的确定、特定基因的功能富集分析、个性化下游分析。


测序仪图片.jpgReads质控.pngChIP-seq差异分析图片.png

PeakCalling图片.jpg





ChIP-seq流程分析图片.png








模式生物小鼠图片.jpg模式生物线虫图片.jpg模式生物拟南芥图片.jpg模式生物果蝇图片.jpg模式生物酵母图片.jpg(3)应用领域




MCF7细胞系图片.jpgCD4+T细胞系图片.jpg



临床样本图片.jpg



(4)ChIP-seq数据分析在医学研究中的应用

通过对ChIP-seq数据进行系统化的生物信息学分析,我们能够获得如下结果:

1)通过检测疾病相关转录调控原件确定该转录调控原件的下游靶基因集合或观察病灶部位内部的表观遗传状态异常;

img16


2)比较疾病样本和正常样本中转录调控原件在染色体上结合位置的差异,选取疾病特异性的转录调控原件结合位点,观察这些位点周围的基因,缩小候选研究基因范围;

img17


3)结合基因表达谱数据和GSEA分析技术判断转录调控原件对下游靶基因的调控方向(激活基因表达为正调控,抑制基因表达为负调控);

4)通过检测转录调控原件结合位点周围的基序特征(Motif),预测与该转录调控原件发生共定位的潜在转录因子,通过数据挖掘尝试找出其他与疾病发生相关的调控基因;

img18

5)基于Gene Ontology和基因功能分类知识库,帮助我们了解候选研究基因和共调控因子的具体功能,从而了解目标转录调控原件在疾病发生过程中所起的生物学作用,帮助我们认识疾病发生过程的分子机制。

(4)参考文献

1、Furey T et al. ChIP–seq and beyond: new and improved methodologies to detect and characterize protein–DNA interactions. Nature (2012) vol. 13 (12) pp. 840-852

2、Yu J et al. An Integrated Network of Androgen Receptor, Polycomb, and TMPRSS2-ERG Gene Fusions in Prostate Cancer Progression. Cell Cancer Cell (2010) vol. 17 (5) pp. 443-454

3、Welboren W et al. ChIP-Seq of ERα and RNA polymerase II defines genes differentially responding to ligands. EMBO Journal (2009) vol. 28 (10) pp.1418-1428


生信分析