【嘉美实验】DNA 羟甲基化是一种重要的表观遗传修饰,对基因的表达起调控作用,在神经分化和癌症中发挥重要的作用。这种新的DNA甲基化修饰形式—5羟甲基胞嘧啶修饰在哺乳动物细胞组织广泛存在。这种羟甲基化修饰被认为是双加氧酶家族TET通过氧化5甲基化胞嘧啶形成的。为深入了解5hmC的作用,我们就必须清楚5hmC在基因组的分布情况。然而,传统的基于Bisulfite的方法无法区分5-hmC和5-mc。5-hmC单克隆抗体捕获法是研究DNA羟基化修饰的利器,结合芯片技术以及生物信息分析,可以获得全基因组羟甲基化分布图,从而能帮助我们从一个新的角度来解析胚胎发育,神经细胞分化以及癌症发生的分子机制。国际知名芯片公司Arraystar和罗氏-NimbleGen设计的羟甲基化DNA免疫共沉淀芯片hMeDIP-chip则为我们检测5hmC的水平提供了有效的研究工具。
嘉美实验为您提供羟甲基化芯片技术服务,可以快速便捷地确定5hmC在ncRNA和mRNA启动子区,以及其他一些重要的基因组区域的分布。您只需要提供保存完好的组织或细胞标本,嘉美的芯片技术服务人员就可为您完成全部实验操作,包括酶消化基因组DNA、5’羟甲基化DNA免疫共沉淀、hMeDIP与 Input DNA片段线性扩增、荧光标记、芯片杂交、图像采集和数据分析、并提供完整的实验报告。
Arraystar 4x180K 启动子芯片Arraystar 启动子芯片是专门为研究启动子区域的甲基化,羟甲基化,组蛋白修饰以及转录因子结合而设计的产品,覆盖所有RefSeq数据库基因的启动子区(Arraystar RefSeq Promoter Array)或是所有非编码RNA的启动子区(Arraystar ncRNA Promoter Array),能够满足不同客户的需求。180 K的芯片,启动子的覆盖范围近2kb,并覆盖了几乎所有启动子区附近的CpG岛,是一款高品质高性价比的羟甲基化芯片产品。
Arraystar RefSeq 启动子芯片产品列表 芯片名称 | 物种 | 规格 | 覆盖范围 |
Arraystar Human RefSeq Promoter Array | Human | 4*180K | 23,148 RefSeq promoters (-1,300 bp ~ +500 bp of TSS) |
Arraystar Mouse RefSeq Promoter Array | Mouse | 4*180K | 22,327 RefSeq promoters (-1,300 bp ~ +500 bp of TSS) |
Arraystar Rat RefSeq Promoter Array | Rat | 4*180K | 15,987RefSeq promoters (-1,300 bp ~ +500 bp of TSS) |
Arraystar ncRNA 启动子芯片产品列表 芯片名称 | 物种 | 规格 | 覆盖范围 |
Arraystar Human ncRNA Promoter Array | Human | 4*180K | 27,248 lncRNA promoters (-1,300 bp ~ +500 bp of TSS) + 622 miRNA promoter (-50 kb to mature miRNA) |
Arraystar Mouse ncRNA Promoter Array | Mouse | 4*180K | 18,552 lncRNA promoters (-1,300 bp ~ +500 bp of TSS) + 346 miRNA promoter (-50 kb to mature miRNA) |
Arraystar 癌症相关甲基化芯片 1、Arraystar 4 x 180K Block芯片Arraystar 4 x 180K Block芯片是专门为研究癌症相关的block区域而设计的产品,覆盖位于7088个block区域中的2554个蛋白编码基因、8481个长链非编码RNA、463个miRNA genes。通过这款芯片可以检测block区域中的基因和LncRNA的甲基化变化,组蛋白修饰以及转录因子结合情况。此外,结合Arraystar Block表达谱芯片,还可以了解甲基化变化与基因表达水平间的联系。
芯片名称 | 物种 | 规格 | 覆盖范围 |
Arraystar Human Block Array | Human | 4*180K | 27MB。位于7088个block区域中的2554个蛋白编码基因、8481个lncRNA、463个miRNA genes |
研究表明:癌症中存在着一些低甲基化的区间(block),这些区间的长度在5kb到10M之间,长度中位值为28kb。1/3的基因转录起点都位于这些block中。此外,这些低甲基化的block与包括LADs*和LOCKs*在内的异染色质区域存在着很大重叠,表明癌症中的甲基化变化与染色质结构改变之间存在着很大的关联性。此外,低甲基化block中包含了绝大部分在肿瘤中表达变异较大的基因。而且,这些区域不仅整体甲基化水平下降,而且相对于正常样品,它们在不同肿瘤样品中甲基化水平变化更加剧烈。这表明:基因在癌症中的平均表达水平和平均甲基化程度固然很重要,它们在不同样品中的均一性也不容忽视,甚至是更加重要。
LADs:与核纤层蛋白结合的DNA区域。
LOCKs(large organized chromatin lysine modifications):富含异翻译后修饰(例如:组蛋白H3K9二甲基化修饰)的异染色质区域。
26个位于低甲基化block区域内的高变异基因的标准表达值(log转化后)。这些基因在肿瘤样品(红色点)中展现出剧烈的表达变异,而在正常样品(蓝色点)中表达变异很小。
2、Arraystar 4 x 180K DMR芯片Arraystar 4 x 180K DMR芯片是专门为研究癌症相关的差异甲基化区域而设计的产品,覆盖12113个与癌症、组织及细胞分化相关的small DMRs, 以及11380个与这些small DMRs相邻的CpG岛及CpG岛岸。通过这款芯片不但可以检测癌症相关的甲基化变化,还可以了解引起这种甲基化变化的CpG岛边界漂移模式,从而更加全面直观的解析癌症甲基化组。
芯片名称 | 物种 | 规格 | 覆盖范围 |
Arraystar Human DMR Array | Human | 4*180K | 51MB 。12113个与癌症、组织及细胞分化相关的small DMRs, 以及11380个与这些small DMRs相邻的CpG岛及CpG岛岸 |
癌症中,除了低甲基化的长区间(block),还存在着许多长度小于5kb的差异甲基化区域(DMRs),被称为small DMRs。大部分癌症或组织特异性的差异甲基化区域(small DMRs)都位于CpG岛边缘2kb以内;相对于CpG岛,这一CpG密度较低区域称之为CpG岛岸(CpG shore)。癌症中,CpG岛边界发生漂移,从而导致CpG岛岸的甲基化水平发生变化:当CpG岛边界向CpG岛内部移动时,CpG岛岸发生超甲基化;当CpG岛边界向外移动时,CpG岛岸发生低甲基化。CpG岛边界的变化导致了基因表达的改变。
DMR区域丧失甲基化稳定性的模式。图中横轴代表基因组特定区域,纵轴代表相应位点的甲基化程度,蓝色的线代表正常样品,红线代表癌症样品,DMRs区域用粉红色的背景标记。癌症相关的甲基化变化可以分为四类主要的模式:a. 甲基化边界外移;b. 甲基化边界内移;c. 甲基化边界消失;d. 通过去甲基化形成的新的DMR区域。
Roche-NimbleGen CpG promoter芯片单芯片设计覆盖所有UCSC注释的CpG岛和所有RefSeq数据库基因的启动子区,720K的人甲基化芯片,基因启动子的覆盖范围达3-4kb,覆盖几乎所有的CpG岛,在500bp长度的区域内可以达到2个CpG位点的灵敏度,是一款覆盖区域非常全面的芯片产品。至今,已有很多国内外生物学家利用NimbleGen CpG启动子芯片的研究成果发表于国际期刊。
芯片名称 | 物种 | 规格 | 覆盖范围 |
Multiplex HG18 CpG Promoter Array | Human | 3*720K | 覆盖22,532个启动子,上游2.44kb至下游0.61kb,以及27,728 CpG islands,共30,848条转录本 |
羟甲基化芯片服务优势1、一站式服务:客户只需要提供保存完好的组织或细胞标本,嘉美的芯片技术服务人员就可为您完成全部实验操作(图1)和数据分析流程,并提供完整的实验报告。
2、 hMeDIP富集效果特异性佳:hMeDIP是获得准确测序数据的关键。嘉美在表观遗传领域有着丰富的经验,hMeDIP平台经过不断地优化,抗体富集效率高和特异性好。
3、严格的质控体系:嘉美实验在hMeDIP-chip每个关键步骤都加入了质控实验。这些QC数据能够评估每个步骤的实验质量。如果达不到标准,我们会重复实验步骤或者优化实验体系,使得每个样品都能够达到质控标准。
4、丰富的生物信息学分析:除了严谨,可靠的实验体系,嘉美实验还有强大的生物信息学团队,为客户提供paper级的图表和深入的数据分析服务
DNA羟甲基化芯片技术服务实验流程1、超声打断基因组将基因组DNA超声打断成400bp-500bpDNA片段
2、羟甲基化DNA免疫共沉淀a. 加热变性并将变性后的单链DNA样品分成两份
b. 其中一份单链DNA样品加入抗5’-羟甲基化胞嘧啶核苷抗体
c. 用免疫磁珠法分离b步样品中5’羟甲基化DNA片段的抗体复合物,样品中其余的非甲基化DNA片段被清洗掉
d. 纯化免疫共沉淀的DNA片段(hMeDIP)
e. 评估免疫共沉淀的富集效率
3、hMeDIP与 Input DNA片段线性扩增使用Sigma WGA Kit对上述两份DNA片段(hMeDIP 与 Input)进行扩增。该步骤使检测的灵敏度得到大幅度提升,用微量的检测样品就能得到精确的检测结果
4、荧光标记对hMeDIP(Cy5)与Input(Cy3)样品分别进行标记
5、芯片杂交标记后的hMeDIP与Input样品混合、变性,与甲基化微阵列检测芯片杂交
6、图像采集和数据分析用高解析度芯片扫描仪检测杂交信号;用专业商用分析软件对杂交结果进行数据提取、标准化、峰值分析、报告
7、 提供实验报告 包括详细的实验方法和芯片实验数据和图表a. Scanning Image:Cy3、Cy5荧光扫描图像
b. Raw Data:包括每个探针的荧光信号强度原始数据
c. Probe Report:经过校正得到每个探针的log2(hMeDIP/input)值以及p-value值。
d. log2(hMeDIP/input)值代表每个探针在hMeDIP DNA和input DNA中的相对富集强度, P-Value表示探针红绿信号差异是由非生物因素造成的概率;P-Value越低,表示该探针越有可能代表一个甲基化事件,P-Value由修正的KS检验算法计算
e. Peaks Report:Peaks代表可能的DNA羟甲基化区域,由专业商用软件计算,报告包括可能的Peaks的染色体定位信息以及Peaks周围的基因和CpG岛的相关信息
f. Summary Report: 提供多样本之间Peaks区域的比较以及汇总以提供参考
8、 Differential Enrichment Peaks(Advanced Analysis)Differential Enrichment Peaks(DEP)利用重复组中多样本log2ratio的平均值分析组间差异甲基化区域,从而使得用重复样本实验数据进行甲基化结果的比较及差异甲基化区域的鉴定成为可能,这对于后续实验及分析是非常重要的。
基本数据分析结果展示 (以Arraystar 4x180K芯片为例)1、羟甲基化峰识别和注释为了消除系统误差和芯片间差异。分别使用中值标准化,quantile标准化和线性平滑的方法对芯片数据做标准化。标准化后的数据使用NimbleScan v2.5 (Roche-NimbleGen)识别羟甲基化峰(peaks)。将找到的羟甲基化峰根据转录本promoter和CpG density的信息做注释。
许多研究表明启动子羟甲基化和下游基因的转录YZ间有密切的关联。据报道,哺乳动物中基因启动子的羟甲基化状态与其GC含量有关。因此我们基于CpG ratio,GC含量和CpG丰富区长度,将启动子分成如下三类:
高CpG密度启动子 (Hgh CpG-density Promoter, HCP): 首先我们定义启动子区为TSS上游0.7kb ~ TSS下游0.2kb。该区域内若有任意一个500bp的窗口,其G+C比例 >= 0.55,并且CpG观测/期望比 (observed/expected, O/E) >= 0.6。
低CpG密度启动子 (Low CpG-density Promoter, LCP): 启动子不包含CpG O/E >= 0.4的500bp长的区域。
中CpG密度启动子 (Intermediate CpG-density Promoter, ICP): 不属于HCP或ICP的启动子。
嘉美实验分别提供了不同类型的启动子区域(HCP,ICP,LCP)的羟甲基化分析结果。下面以HCP为例,展示了羟甲基化峰注释表格。
EnrichmentPeaksInHCP表格:每一个样品中对应到HCP的peaks,包括HCPs和peaks的详细信息。
SummaryEPInHCP表格:所有样品中对应到HCP的peaks数目,表格中不包括peaks的详细信息,用计数的方式表示某个HCP在特定样品中的对应的peaks数目。
2、差异羟甲基化(DEP)分析两组样品进行比较,筛选差异富集峰(DEP)即差异羟甲基化区域的。我们使用每组log2-ratio的均值,并为每个探针计算M’ value。然后将结果导入NimbleScan进行peak finding,找到的peaks便是差异羟甲基化区域(DEP)。嘉美实验分别提供了不同类型的启动子区域(HCP,ICP,LCP)的差异羟甲基化分析结果。下面以HCP为例,展示了差异羟甲基化表格。
适用范围:两个或两组样品间的比较
DEPInHCP表格:每个比较中找到对应有HCP的DEP。
Control vs Expriment比较中在chr1上1235129~1235386区域的peak。该peak对应的是ACAP3基因的启动子,这个启动子属于HCP类型。
SummaryInHCP 表格:所有比较对应有HCP的DEP。表格中不包括peaks的详细信息,用计数的方式表示某个HCP在特定比较中的DEP数目。
以下表行为例:显示的是Expriment vs Control比较中有一个DEP在基因AADAT的启动子上,这个基因的启动子属于HCP类型启动子。
3、 差异羟甲基化基因的GO分析为了方便客户了解启动子差异羟甲基化基因的功能,嘉美实验还分别提供了差异羟甲基化基因的GO分析。
适用范围:两组或多组数据比较获得的差异羟甲基化的基因
4、差异羟甲基化基因的Pathway分析为了方便客户了解启动子差异羟甲基化基因参与的生物学过程,嘉美实验还分别提供了差异羟甲基化基因的Pathway分析。
适用范围:两组或多组数据比较获得的差异羟甲基化的基因
5、可视化嘉美实验提供GFF 格式的hMeDIP-Chip羟甲基化谱数据,可以通过SignalMap软件进行可视化。通过可视化话图,客户可以直观的了解具体区域或基因的羟甲基化情况,已经样品间的差异羟甲基化状况。
用Signal map显示样品间差异甲基化区域。
图中红色为样品1,蓝色为样品2.
EP:单个样品中羟甲基化富集的区域(Enrichment peak);
DEP:样品间差异羟甲基化区域(Differentially enrichment peak)
高级数据分析结果展示1、表达谱数据 (mRNA, LncRNA, miRNA) & 羟甲基化芯片数据联合分析通过表达谱数据和羟甲基化芯片数据联合分析,可以找出受甲基化调控的mRNA,LncRNA和miRNA。下面的两个图为mRNA表达谱数据与相应羟甲基化芯片联合分析结果。
适用范围:同时具表达谱数据和羟甲基化谱数据的样品
联合分析列表
上图:展示了羟甲基化芯片结果D40 vs D20羟甲基化程度增加且表达谱芯片结果D40 vs D20 表达下调2.0倍的基因