官网 http://www.shbio.com/
染色体水平的缺失、重复等变化是细胞遗传学研究的热点。以往科学家运用核型分析、荧光原位杂交等技术已获得染色体结构变异的许多可贵进展,但这些传统技术分辨率低、且只能定性分析。Affymetrix推出「CytoScanTM HD细胞遗传学芯片」解决了上述问题,能够在全基因组范围内高分辨率的检测DNA拷贝数的变异。可通过CytoScanTM HD 芯片对XX疾病进行CNV分析,在疾病组与正常对照间筛选与疾病所关联的拷贝数变异。通过找到的拷贝数变异进一步定位与疾病相关的致病基因,为研究其分子机制提供线索。
DNA的甲基化修饰是表观遗传研究中的一个热点,在基因调控过程中扮演着重要的角色。它在维持组织特异性表达谱,使细胞获得并保持特定状态中起着重要作用。同时也调控着染色质稳定性、印迹基因表达调控、X染色体失活及抑制病毒和外源基因的表达等生物过程。更重要的是,在许多复杂疾病或生命过程的发生、发展中,也与DNA甲基化对基因的表达调控密切相关,这些疾病包括:癌症、神经系统紊乱、老化以及发育。可通过「Illu-mina Infinium Methylation EPIC BeadChip芯片」(下文以850K芯片代称)对XX疾病进行甲基化分析,研究疾病的表观遗传分子机制。
研究线路
CNV、甲基化分析与EWAS的分析线路分别见下图。
Affymetrix基因芯片数据分析路线
850K芯片数据分析技术路线
EWAS关联分析技术路线
结果展示
1. 甲基化芯片数据分析
图1-1 β值密度曲线图
注:每个样本beta值密度曲线,以判断样本间是否出现了整体的甲基化修饰差异。
图1-2 聚类图
注:对样本的甲基化修饰信号采取非监督聚类,根据样本与样本间的相似度,甲基化谱相近的样本聚在一起。
图1-3 MDS图
注:类似于PCA图,在二维平面中将类似的样本放在相近的位置,可帮助了解实验设计中的分组情况。
为了挖掘高甲基化或低甲基化的基因是否有染色体的偏向性或成簇分布的特点将样本分组间差异甲基化位点定位在染色体上。
图1-4 差异甲基化位点在染色体分布图
注:红色代表实验组(g1)高甲基化位点,绿色代表实验组(g1)低甲基化基因位点,灰色表示甲基化位点在组间没有变化。
注:以1K的窗口得出基因组的覆盖情况,标示基因组的甲基化水平。图中最外圈为基因组,里面每一个圈标示样本基因组甲基化水平。
图1-6 差异的甲基化位点的热图
注:类似于表达谱芯片的热图,将高甲基化的位点用红色表示,低甲基化的位点用绿色表示,在一张图上展示所有差异甲基化修饰位点在不同样本间的分布。
2. EWAS分析
不同个体间的血细胞组成会有差异,不同的分组间的血细胞组成也可能会有差异,而不同的细胞的甲基化谱也会有差异。通过对不同细胞类型的甲基化谱以及不同样本的细胞成分进行校正后,能够有效地减少由于血细胞组成不同而出现的关联位点。
图2-1 对不同组分进行矫正后的火山图
注:经过对不同血细胞组成的甲基化修饰水平校正后,关联的探针数目显著地减少。
对于疾病因素或加上年龄、性别等协变量因素进行关联分析,通过对所有位点的P值的观测值与期待值进行排序后的展示,得到不同因素的QQ-plot,可用于展示在不同因素下,CpG位点的甲基化修饰与疾病的关联紧密度。
图2-2 QQ-plot
对于所有位点的P值取对数后绘制Manhattan plot,可以用来观测各个染色体中显著差异甲基化探针探针的数据分布。与普通的GWAS类似,关联性很强的位点可能会出现在MHC区域处,在后续的分析中,可以把MHC区域内的位点单独进行分析。
图 2-3 Manhattan plot图
注:基因组坐标沿X-轴显示,显示在Y-轴为每个基因甲基化水平的关联P值的负对数。
对于连续的表型变量,可以通过散点图展示筛选得到的位点的甲基化水平及其与病理表型的关联程度。同时,如果有位点对应基因的表达水平,可以将此位点的甲基化水平与表达水平结合起来绘制散点图。
图2-4 甲基化程度与对应表型的散点图
如果病理表型不是连续变量,可以通过下图来展示位点的甲基化水平与表型的关联程度。
图2-5 甲基化程度与对应表型的箱线图
3. 多组学的整合分析
3.1 整体展示
通过圈图在整体上展示全基因组水平上的甲基化水平及基因表达差异,也可以将CNV甚至是SNV也同时展示出来。
图3-1 甲基化修饰、miRNA以及基因表达水平的圈图
在二维的平面坐标系中,通过基因的表达以及基因启动子区的甲基化的关联,每个点代表一个基因,来展示甲基化是否对基因的表达起到负调控作用。
图3-2 甲基化修饰、miRNA以及基因表达水平的散点图
注:X轴与Y轴分别代表基因的表达以及基因的甲基化水平。
通过热图展示甲基化修饰以及基因表达,或将不同水平的变化放在同一张图中展示。
图3-3 甲基化修饰、miRNA或基因表达水平差异的热图
图3-4 不同水平甲基化修饰、miRNA或基因表达水平差异的热图
3.2 网络图展示
3.2.1 mRNA,miRNA转录组与甲基化整合分析
通过互作网络图展示基因与甲基化修饰以及基因表达水平改变的互作关系。
图3-5 甲基化修饰、基因表达,以及基因的互作网络图
注:用三角形箭头的方向表示甲基化水平的高低; 用红色表示基因的上调,绿色表示基因的下调; 连线表示基因的互作网络。
通过互作网络图展现mRNA,lncRNA,circRNA以及的互作关系。
图3-6 甲基化修饰、miRNA及基因表达的互作网络图
注:三角形代表上下调,上箭头:上调;下箭头:下调。节点的颜色代表该基因同甲基化数据之间的相关程度,绿:负相关;红:正相关;黄:不相关,见color_bar。节点的面积代表在该网络中这个节点与其他节点之间的作用力度,可根据客户要求调节。
3.2.2 关键通路与基因表达水平、甲基化修饰或基因组水平变异的联合分析
通过热图与网络图相结合等形式,将差异的表达、甲基化修饰或基因组变异与关键的变化通路整合展示,集中展示关键基因、关键通路及其相互关系(见图A)。对于筛选出来的关键基因,可以在基因的表达结果、甲基化差异基础上,结果序列变异及拷贝数变异以热图、聚类图进行多层面展示(见图B)。
Buhule, O. D., R. L. Minster, et al. (2014). "Stratified randomization controls better for batch effects in 450K methylation analysis: a cautionary tale." Front Genet 5: 354.
Byrne, E. M., T. Carrillo-Roa, et al. (2013). "Monozygotic twins affected with major depressive disorder have greater variance in methylation than their unaffected co-twin." Transl Psychiatry 3: e269.
Clark, C., P. Palta, et al. (2012). "A comparison of the whole genome approach of MeDIP-seq to the targeted approach of the Infinium HumanMethylation450 BeadChip((R)) for methylome profiling." PLoS One 7(11): e50233.