DNA甲基化芯片
(1)简介
DNA甲基化是表观遗传学的重要组成部分,在维持正常细胞功能、遗传印记、胚胎发育以及人类肿瘤发生中起着重要作用,是目前新的研究热点之一。随着对甲基化研究的不断深入,各种各样甲基化检测方法应运而生。其中,MeDIP-chip(MeDIP: Methylated DNA Immunoprecipitation)是目前高通量分析基因组DNA甲基化变化的一种准确可靠的实验技术,运用该技术,可以检测全基因组范围内的甲基化位点;研究启动子甲基化对基因的调控;比较不同组织、细胞、肿瘤等的甲基化图谱以及寻找诊断和预后的分子标志物。
(2)实验流程
1)超声打断基因组:
将基因组DNA超声打断成400bp-500bp DNA片段
2)甲基化DNA免疫共沉淀:
a) 加热变性并将变性后的单链DNA样品分成两份
b) 其中一份单链DNA样品加入抗5’-甲基化胞嘧啶核苷抗体
c) 用免疫磁珠法分离b步样品中甲基化DNA片段的抗体复合物,样品中其余的非甲基化DNA片段被清洗掉
d) 纯化免疫共沉淀的DNA片段(MeDIP)
3)MeDIP与Input DNA片段线性扩增:
使用Sigma WGA Kit对上述两份DNA片段(MeDIP与Input)进行扩增。该步骤使检测的灵 敏度得到大幅度提升,用微量的检测样品就能得到精确的检测结果
4)荧光标记:
对MeDIP(Cy5)与Input(Cy3)样品分别进行标记
5)芯片杂交:
标记后的MeDIP与Input样品混合、变性,与甲基化微阵列检测芯片杂交
6)图像采集和数据分析:
用高解析度芯片扫描仪检测杂交信号;用专业商用分析软件对杂交结果进行数据提取、标准化、峰值分析、报告
7)提供实验报告 包括详细的实验方法和芯片实验数据和图表:
● Scanning Image:Cy3、Cy5荧光扫描图像
● Raw Data:包括每个探针的荧光信号强度原始数据
● Probe Report:经过校正得到每个探针的log2(MeDIP/input)值以及p-value值
●log2 (MeDIP/input)值代表每个探针在MeDIP DNA和input DNA中的相对富集强度, P-Value表示探针红绿信号差异是由非生物因素造成的概率;P-Value越低,表示该探针越有可能代表一个甲基化事件,P-Value由修正的KS检验算法计算
● Peaks Report:Peaks代表可能的DNA甲基化区域,由专业商用软件计算,报告包括可能的Peaks的染色体定位信息以及Peaks周围的基因和CpG岛的相关信息
● Summary Report:提供多样本之间Peaks区域的比较以及汇总以提供参考
8. Differential Enrichment Peaks(Advanced Analysis):Differential Enrichment Peaks(DEP)利用重复组中多样本log2ratio的平均值分析组间差异甲基化区域,从而使得用重复样本实验数据进行甲基化结果的比较及差异甲基化区域的鉴定成为可能,这对于后续实验及分析是非常重要的。
(3)Arraystar甲基化芯片基本数据分析结果展示
1)甲基化峰识别和注释
为了消除系统误差和芯片间差异。分别使用中值标准化,quantile标准化和线性平滑的方法对芯片数据做标准化。标准化后的数据使用NimbleScan v2.5 (Roche-NimbleGen)识别甲基化峰(peaks)。将找到的甲基化峰根据转录本promoter和CpG density的信息做注释。
许多研究表明启动子甲基化和下游基因的转录抑制间有密切的关联。据报道,哺乳动物中基因启动子的甲基化状态与其GC含量有关。因此我们基于CpG ratio,GC含量和CpG丰富区长度,将启动子分成如下三类:
高CpG密度启动子(Hgh CpG-density Promoter, HCP):首先我们定义启动子区为TSS上游0.7kb ~ TSS下游0.2kb。该区域内若有任意一个500bp的窗口,其G+C比例>= 0.55,并且CpG观测/期望比(observed/expected, O/E) >= 0.6。
低CpG密度启动子(Low CpG-density Promoter, LCP):启动子不包含CpG O/E >= 0.4的500bp长的区域。
中CpG密度启动子(Intermediate CpG-density Promoter, ICP):不属于HCP或ICP的启动子。
不同类型启动子的甲基化具有不同的调控功能:
①高CpG密度启动子(HCP)的甲基化
在胚胎干细胞中,大部(> 95%)的HCPs是非甲基化的,受到trithorax蛋白(trxG,与H3K4me3相关)和Polycomb蛋(PcG,与H3K27me3相关)调控。HCP被认为多参与看家基因的表达调控。
②中CpG密度启动子(ICP)的甲基化
体细胞中,中等的CpG密度启动子往往更容被从头甲基化。在小鼠中的实验结果表明ICPs容易被甲基化可能是在哺乳动物中普遍存在的现象。
③低CpG密度启动子(LCP)的甲基化
LCPs的DNA甲基化和基因表达似乎没有明显的相关性。大部分的LCPs不论基因是活跃或者沉默都有甲基化。这暗示低密度的DNA甲基化并不会影响到基因的表达。
Aksomics分别提供了不同类型的启动子区域(HCP,ICP,LCP)的甲基化分析结果。下面以HCP为例,展示了甲基化峰注释表格。
EnrichmentPeaksInHCP表格:每一个样品中对应到HCP的peaks,包括HCPs和peaks的详细信息。
SummaryEPInHCP表格:所有样品中对应到HCP的peaks数目。
2)差异甲基化(DEP)分析
两组样品进行比较,筛选差异富集峰(DEP)即差异甲基化区域的。我们使用每组log2-ratio的均值,并为每个探针计算M' value。然后将结果导入NimbleScan进行peak finding,找到的peaks便是差异甲基化区域(DEP)。我们分别提供了不同类型的启动子区域(HCP,ICP,LCP)的差异甲基化分析结果。下面以HCP为例,展示了差异甲基化表格。
适用范围:两个或两组样品间的比较
DEPInHCP表格:每个比较中找到对应有HCP的DEP。
Control vs Expriment比较中在chr1上1235129~1235386区域的差异甲基化峰(DEP)。该DEP对应的是ACAP3基因的启动子,这个启动子属于HCP类型。
SummaryInHCP表格:所有比较中对应到特定HCP的DEP。用计数的方式表示某个HCP在特定比较中的DEP数目。
以上表第一行为例:显示的是Expriment vs Control比较中有一个DEP在基因AADAT的启动子上,这个基因的启动子属于HCP类型启动子。
3)差异甲基化基因的GO分析
为了方便客户了解启动子差异甲基化基因的功能,Aksomics提供了差异甲基化基因的GO分析。
适用范围:两组或多组数据比较获得的差异甲基化的基因
4)差异甲基化基因的Pathway分析
为了方便客户了解启动子差异甲基化基因参与的生物学过程,Aksomics提供了差异甲基化基因的Pathway分析。
适用范围:两组或多组数据比较获得的差异甲基化的基因
5)可视化
Aksomics提供GFF格式的MeDIP-Chip甲基化谱数据,可以通过SignalMap软件进行可视化。通过可视化图,客户可以直观的了解具体区域或基因的甲基化情况,已经样品间的差异甲基化状况。
图释:用Signal map显示样品间差异甲基化区域。图中红色为样品1,蓝色为样品2.EP:单个样品中甲基化富集的区域(Enrichment peak); DEP:样品间差异甲基化区域(Differentially enrichment peak)
Aksomics高级数据分析结果展示
表达谱数据(mRNA, LncRNA, miRNA) &甲基化芯片数据联合分析
通过表达谱数据和甲基化芯片数据联合分析,可以找出受甲基化调控的mRNA,LncRNA和miRNA。下面的两个图为mRNA表达谱数据与相应甲基化芯片联合分析结果。
适用范围:同时具表达谱数据和甲基化谱数据的样品
●联合分析列表
*图释:上图展示了甲基化芯片结果D40 vs D20甲基化程度增加且表达谱芯片结果D40 vs D20表达下调2.0倍的基因
●通过联合分析的结果做HeatMap分析