DCAM-13:MeDIP芯片技术与甲基化综合数据分析 MeDIP(methylated DNA immunoprecipitation 甲基化DNA免疫共沉淀)技术已经被广泛应用于测定生物细胞在不同发育时期,临床表型,以及环境作用下的全基因组DNA甲基化状态研究。基于MeDIP的研究显示抗体富集度一定程度上反映决定了DNA甲基化水平,并且与RNA 聚合酶II的结合性(即转录活性的激活或者YZ状态)存在相关性。然而,通过MeDIP富集程度来准确的估计DNA甲基化水平仍然存在很多尚待解决的问题。
首先,MeDIP分析强制假设MeDIP富集度与DNA真实的甲基化水平呈线性相关,这种假设可能是错误的;其次,有研究表明DNA甲基化水平是抗体富集程度的函数,并且极大的取决于对应区域上的CpG整体含量。ZH,MeDIP富集程度取决于富集片段与input片段
之间的log比(即logR),然而这种度量却无法给出直观的解释,使得研究者武断的判断过甲基化或者低甲基化区域。因此,鉴于上述传统甲基化芯片分析的潜在问题,本方案将采用非线函数评估抗体富集度浓度(MeDIP enrichment)与真实的甲基化水平之间的关系,提高DNA甲基化水平预估数值的准确性。
本方案将对基因组上启动子类型根据CpG密度(CpG frequency)进行分类, 对不同启动子甲基化程度的各自特征进行分析, 包括
(1) High-CpG promoters (HCPs);
(2) low-CpG promoters (LCPs);
(3) Promoters with intermediate CpG content, 启动子具偏低水平CpG islands;
本方案适合于分析:NimbleGen 和Illumina,Affymetrix的DNA甲基化芯片
(1)芯片数据预处理: 芯片标准化处理: 组内标准化 (Loess based) 以及组间标准化处理 (Quantile based);
(2)芯片探针的基因组注释分析:每个探针的ZX坐标将定位到基因组的已知的RefSeqs (来自UCSC human genome)上;7种不同的基因组区域将被考虑进入后续分析:包括: intergenic, intergenic,upstream,promoter, exon,intron, 5 UTR, 3 UTR.
(3)启动子注释分析
(a)对UCSC来源的启动子序列去冗余分析;包括去除长度延伸小于400bp的启动子,Y染色体上的启动子,以及缺乏足够证据支持的启动子,这些启动子会反映出基因间DNA甲基化的水平。
(b)筛选有效的启动子序列用于后续分析: 包括有 First Exon Finder (FirstEF) 启动子预测支持的证据,以及RefSeq记录支持的启动子;
(4) 启动子类别的定义与分类
HCPs (high-CpG promoters) : LCPs (low-CpG promoters); ICP( neither HCPs nor LCPs) (参见图例-2)
(5)分析三种启动子序列上甲基化程度与分布(参见图例-3),以及在不同样本之间三类启 动子的甲基化程度的分布(饼图)
(6)甲基化区域的基因功能分类分析
图例-1 (a) MeDIP实验策略数据分析流程
图例-1(b) 根据非线性模型预测的DNA甲基化水平峰值和在基因组上的坐标
图例-2 全基因组启动子分类
图例-3 不同启动子类别的甲基化水平及其分布 更多详情:http://www.biogenius.cn/htm/solution/Biochip/78.html
Big Data , Big Idea !
惠研生物,提供领先的生物大数据解决方案!
- 全基因组测序/外显子组, 转录组等项目共计 完成近万个样本的测序与分析服务
- 累计协助客户发表权威SCI论文总IF超过 160分
- 512核心CPU,1T内存 满足大规模并行的,敏捷的数据分析服务;
- 1PB 数据磁盘阵列保证企业级 测序分析结果存储的安全稳定
官方网站:www.biogenius.cn
咨询热线:400-016-9606 / 180-1908-2932
官方微信: 微信公众平台搜索 “惠研生物”
官方QQ: 1744353207
咨询邮箱: service@biogenius.cn