全基因组基因表达谱的检测对疾病研究有非常重要的意义。一方面,基因表达谱的检测可以应用于疾病生物标记物的筛选。另一方面,基因表达谱的检测可以为基因功能研究提供线索,有助于揭示疾病发SF展的分子机制。 虹舜生物为您提供全基因组表达谱芯片技术服务,您只需要提供保存完好的组织或细胞标本及标本信息,虹舜生物就可为您完成全部实验操作及数据分析,为您提供完整的实验报告。 | Agilent表达谱芯片产品列表 : 芯片名称 | 种属 | 格式 | 基因数 | Database source | Whole human genome | 人 | 4 x 44K | ~41,000 | Goldenpath, Ensembl, Unigene, Human Genome (Build 33), Refseq, GebBank | whole mouse genome | 小鼠 | 4 x 44K | ~41,000 | USC mRNA known genes, Natl. Institute on Aging, Genbank, Unigene, Refseq, Ensembl, RIKEN | whole rat genome | 大鼠 | 4 x 44K | ~41,000 | Ensembl, UCSC Goldenpath, Unigene, Refseq, Genbank | SurePrint G3 Human Gene Expression 8x60K v2 Microarray | 人 | 8 x 60 K | ~50,000 | RefSeq, Ensemble, Unigene, GenBank, Broad Institute Human lincRNA and TUCP catalog | SurePrint G3 Mouse GE 8x60K Microarray | 小鼠 | 8 x 60 K | ~40,000 | RefSeq, Ensembl, Unigene, GenBank, RIKEN | SurePrint G3 Rat GE 8x60K Microarray | 大鼠 | 8 x 60 K | ~30,000 | RefSeq, Ensembl,Unigene, GenBank | Agilent还提供多类物种的表达谱芯片: 动物:兔、猪、斑马鱼、果蝇等 植物:水稻、玉米、拟南芥、烟草等 微生物:大肠杆菌、酵母等 表达谱 芯片特点: · 独特的喷墨原位合成技术; · 探针长度60mer,可以兼顾灵敏性和特异性,使二者达到良好的平衡; · 由于采取长探针设计,有利于捕捉对生命活动有重要意义的低丰度基因; · 芯片随数据库及时更新,基因信息更新更全,可升级到芯片版本; · 灵活的定制方案,仅需基因组或EST序列,客户即可任意制作自己的芯片; · 平均CV<10%(MAQC:Nature Biotechnology Sept,2006); · 芯片具有良好的可重复性,相关系数R2>0.95(MAQC); · 芯片数据结果与qPCR数据结果具有良好的相关性,相关系数R2>0.9(MAQC )。 表达谱芯片实验流程: 对基因芯片数据的标准化处理, 主要目的是消除由于实验技术所导致的表达量(Intensity)的变化,并且使各个样本(sample)和平行实验的数据处于相同的水平,从而使我们可以得到具有生物学意义的基因表达量的变化。对于表达谱芯片,一般采用的标准化方法有分位数标准化(Quantile Normalization)。 芯片原始数据经过标准化处理后,在一个二维直角坐标系平面中,绘制散点图。芯片数据的散点图常用语评估两组数据总体分布集中确实。散点图中每一个点代表芯片上的探针点,该点在二维平面中的位置由其X轴和Y轴坐标确定。 2、差异筛选统计分析 对于同一影响因素下的2组数据,每组数据3个以上生物学重复的实验设计,采取T-Test方法进行单因素统计分析。例如试验组3个样本,对照组3个样本,比较两组间的差异基因 b.图形数据 单荧光芯片数据组间T-Test分析得到p-value值与FC值,两个因素共同绘制火山图(Volcano Plot),用于显示两组样数据的显著性差异。在火山图中,横坐标显示两组比较下log2转换后的倍数差异值,纵坐标显示由T-Test计算出来的-log10(pvalue)。 3、聚类分析 为了全面而直观地展示样品之间的关系及基因表达差异情况,将表达基因做层次聚类分析。用挑选的基因的表达情况来计算样品直接的相关性。一般来说,同一类样品能通过聚类出现在同一个簇(Cluster)中,聚在同一个簇的基因可能具有类似的生物学功能。 4、主成分分析(PCA) PCA(Principal Component Analysis)的原理是找到数据方差的两个或者三个主成分(向量),将数据投影在这些主成分上,以达到降维的目的,通过图像上的点之间的相互距离来显示样本之间的相似度。通过PCA分析,可以观察样本的分布情况,验证试验设计的合理性,考察生物学重复样本的均一性。各组样本分布在二维空间的不同区域,同组的样品在空间分布比较集中,说明这些基因选取具有代表性。 5、样本相关性分析 6、GO分析 Gene Ontology(简称GO)是基因功能国际标准分类体系。GO可分为分子功能(Molecular Function),生物过程(Biological Process)和细胞组成(Cellular Component)三个部分。GO-Analysis对差异基因等按GO分类,并对分类结果进 行基于离散分布的显著性分析、误判率分析、富集度分析,得出与实验目的有显著联系的、低误判率的、靶向性的基因功能分类,该分类即导致样本性状差异的Z重要的功能差别。通过该分析有可能找到导致性状变化的重要功能,并且找到该功能所对应的基因。 7、Pathway分析 信号通路(Pathway)是多个基因间相互作用,共同调节细胞功能和代谢活动的过程。而信号通路分析是通过对差异基因按照Pathway的主要公共数据库KEGG来进行分类,得到与实验目的有显著联系的Pathway 类别。 8、基因表达趋势分析(STC) 对于按照处理时间、浓度、疾病恶化程度顺序设计的序列实验,为了筛选出随样本顺序变化影响Z显著、Z主流的基因群,需要对样本的差异基因进行基因表达趋势分析。应用模糊聚类等机器学习方法,计算出随着时间、浓度梯度或恶性程度等变化过程中基因的表达趋势,得到相应的主流表达趋势,其所属基因的表达变化是与时间、浓度或恶性程度具有显著性联系的基因,主流表达趋势所属基因将作为进一步研究的目标基因。 |