第八章基因芯片 第一节概述 DNA芯片也叫基因芯片(Gene chip)是指在固相载体(玻璃、硅等)上有序地、高密 度地(点间距<500μm)排列固定了大量的靶基因或寡核苷酸,也叫探针。这些被固定的分子 探针在基质上形成 高密度的DNA微阵列,因此, DNA芯片又叫DNA微矩阵(DNA Microarray)。第 块基因芯片1992年诞生在美 DNA芯片属于生物芯片(biochip)的范畴,生物芯片分为DNA芯片、蛋白质芯片及 其它芯片(样品制备芯片、核酸扩增芯片、毛细管电泳芯片等)三类。 第二节DNA芯片的基本原理 l.基因芯片技术是建立在Southern blot基础之上的,可以说它是Southern blot的改进和发展, 它的原理是:变性DNA加入探针后在一定温度下退火,同源片段之间通过碱基互补形成双 薛杂交分子。 S:DNA-DNA/RNA N:RNA-DNA/RNA W:Protein-protein/DNA: E:Genome DNA-DNA/RNA (Dot blot) 2.基因芯片与Southern blot之比较 基因芯片的基本原理与Southern blot技术一脉相承,点样技术和数据读取技术的发展是 基因芯片技术对传统核酸杂交的技术性突破,因此,基因芯片技术是基因功能研究领域的一 次革命。通过基因芯片人们可以大规模、高通量(海量)地对成千上万个基因进行同时研究。 与Southern blot相比较,基因芯片具有高密度、高通量、并行性、微量化、自动化的特 点。 3.基因芯片基本操作流程 制备总RNA→mRNA经RT-PCR用Cy3(正常对照组)和Cy5(实验组)荧光标记目 的基因,得到cDNA探针一混合标记探针一与表达谱芯片上核苷酸片段(或基因)杂交 扫描一分析杂交结果一结论 载体+寡核苷酸探针分子+荧光染料点样仪扫描仪计算机+专业软件 第三节DNA芯片的种类 一、表达谱基因芯片 用于基因功能的研究。原理:用不同的荧光染料通过RT-PCR标记不同来源的细刷 mRNA制备成探针,将探针混合后与芯片上的基因杂交、洗涤、扫描,得到这些基因在不 同组织或个体中的表达诺 ,再通过计算机分析这 基因在不同组织或个体中的表达差异,得 出这些基因表达的重要信息。即高表达、低表达或不表达。 二、诊断芯片 在DNA和/或RNA水平上用于疾病诊断,如肝癌、糖尿病等
第八章 基因芯片 第一节 概述 DNA芯片也叫基因芯片(Gene chip)是指在固相载体(玻璃、硅等)上有序地、高密 度地(点间距<500m)排列固定了大量的靶基因或寡核苷酸,也叫探针。这些被固定的分子 探针在基质上形成高密度的DNA微阵列,因此,DNA芯片又叫DNA微矩阵( DNA Microarray)。第一块基因芯片1992年诞生在美国。 DNA 芯片属于生物芯片(biochip)的范畴,生物芯片分为 DNA 芯片、蛋白质芯片及 其它芯片(样品制备芯片、核酸扩增芯片、毛细管电泳芯片等)三类。 第二节 DNA 芯片的基本原理 1.基因芯片技术是建立在 Southern blot 基础之上的,可以说它是 Southern blot 的改进和发展, 它的原理是:变性 DNA 加入探针后在一定温度下退火,同源片段之间通过碱基互补形成双 链杂交分子。 S; DNA-DNA/RNA; N:RNA-DNA/RNA; W:Protein-protein/DNA; E:Genome DNA-DNA/RNA(Dot blot) 2.基因芯片与 Southern blot 之比较 基因芯片的基本原理与 Southern blot 技术一脉相承,点样技术和数据读取技术的发展是 基因芯片技术对传统核酸杂交的技术性突破,因此,基因芯片技术是基因功能研究领域的一 次革命。通过基因芯片人们可以大规模、高通量(海量)地对成千上万个基因进行同时研究。 与 Southern blot 相比较,基因芯片具有高密度、高通量、并行性、微量化、自动化的特 点。 3. 基因芯片基本操作流程 制备总 RNA→ mRNA 经 RT-PCR 用 Cy3(正常对照组)和 Cy5(实验组)荧光标记目 的基因,得到 cDNA 探针→ 混合标记探针→与表达谱芯片上核苷酸片段(或基因)杂交→ 扫描→分析杂交结果→结论 载体+寡核苷酸-探针分子+荧光染料-点样仪-扫描仪-计算机+专业软件 第三节 DNA 芯片的种类 一、表达谱基因芯片 用于基因功能的研究。原理:用不同的荧光染料通过 RT-PCR 标记不同来源的细胞 mRNA 制备成探针,将探针混合后与芯片上的基因杂交、洗涤、扫描,得到这些基因在不 同组织或个体中的表达谱,再通过计算机分析这些基因在不同组织或个体中的表达差异,得 出这些基因表达的重要信息。即高表达、低表达或不表达。 二、诊断芯片 在 DNA 和/或 RNA 水平上用于疾病诊断,如肝癌、糖尿病等
三、检芯片 HBV、HCV、结核杆菌等病原体检测,商检等 第四节基因芯片的应用 一、杂交测序和基因作图 杂交测序 (SBH)是发展基因芯片技术的初衷,希望能够提供一种新的、快速的测序方 法。原理:理论上有4个长度为的序列,可以被分析的目标长度大约等于点阵上寡核苷 酸数目的平方根。 基因绘图:用光蚀刻技术在载体上合成大规模有序的寡核苷酸序列(标签序列),然后 与克隆文库中的每个克隆进行杂交,通过鉴定基因与基因间的大量标签序列(EST,STS等), 以较低的等价基因组数把他们绘制成重叠图。 附:标签序列 expressed sequence tags,.ST表达序列标签,为cDNA的部分序列,平均为300-500bp,它 可以确定基因的种类和所代表基因表达的拷贝数。目前,公共数据库中可利用的人类EST 超过100万个,它可能代表所有人类基因的50%-90%。 序列标签位点,是指染色体定位明确,而且可以用PCR扩增的单 般每隔100kb距离就有一个标记 二、检测基因突变 如果基因易发生突变区段的核苷酸序列是已知的,则DNA芯片能很容易地通过再测序 鉴别出仅1个碱基的错配。以下面的15的探针为例,每个探针只有中间一个核苷酸不同, 以红体下划线表示 1.GCTACTCATGCGTAC 2.CTACTCAIGCGTACT 3.TACTCATGCGTACTC 5. CTCATGCGT AC T C CG 6.TCATGCGIACTCCGT 三、基因表达分析 1、肺癌相关基因的表达研究 黄达辉毛裕民等 用含4O96条©DNA基因的表达谱芯片研究一组肺癌组织样本的基因表达谱,共筛选出 差异表达的基因 370条 包含已知基因146条 ,未知基因224条,其中107条表达增加,263 条表达降低。(第二军医大学学报,2000,21(9):827-830 2、基因芯片对PMA激活的血管内皮细胞早期反应基因的研究吴超群,李瑶,毛裕民, 描要:用含4096条人举基因的DNA芯片研究PMA激活的血管内皮细胞ERG的表达普 作用6仙后,17条基因 表达上 ,11条基因下调。数据分析表明1 条上调基因中13条属于 蛋白质磷酸酶和转录调控因子基因,而下调基因中9条为细胞分裂相关蛋白,从而证明PM 激活的人血管内皮细胞ERG主要是转录调控因子基因和蛋白质磷酸酶基因。 四、基因芯片在肿瘤研究中的应用
三、检测芯片 HBV、HCV、结核杆菌等病原体检测,商检等。 第四节 基因芯片的应用 一、杂交测序和基因作图 杂交测序(SBH)是发展基因芯片技术的初衷,希望能够提供一种新的、快速的测序方 法。原理:理论上有 4 n 个长度为 n 的序列,可以被分析的目标长度大约等于点阵上寡核苷 酸数目的平方根。 基因绘图:用光蚀刻技术在载体上合成大规模有序的寡核苷酸序列(标签序列),然后 与克隆文库中的每个克隆进行杂交,通过鉴定基因与基因间的大量标签序列(EST,STS 等), 以较低的等价基因组数把他们绘制成重叠图。 附:标签序列 expressed sequence tags, EST: 表达序列标签,为 cDNA 的部分序列,平均为 300-500bp,它 可以确定基因的种类和所代表基因表达的拷贝数。目前,公共数据库中可利用的人类 EST 超过 100 万个,它可能代表所有人类基因的 50%-90%。 sequence tagged site,STS: 序列标签位点,是指染色体定位明确,而且可以用 PCR 扩增的单 拷贝序列,一般每隔 100kb 距离就有一个标记。 二、检测基因突变 如果基因易发生突变区段的核苷酸序列是已知的,则 DNA 芯片能很容易地通过再测序 鉴别出仅 1 个碱基的错配。以下面的 15nt 的探针为例,每个探针只有中间一个核苷酸不同, 以红体下划线表示。 1. G C T A C T C A T G C G T A C 2. C T A C T C A T G C G T A C T 3. T A C T C A T G C G T A C T C 4. A C T C A T G C G T A C T C C 5. C T C A T G C G T A C T C C G 6. T C A T G C G T A C T C C G T 三、基因表达分析 1、肺癌相关基因的表达研究 黄达辉 毛裕民等 用含 4096 条 cDNA 基因的表达谱芯片研究一组肺癌组织样本的基因表达谱,共筛选出 差异表达的基因 370 条,包含已知基因 146 条,未知基因 224 条,其中 107 条表达增加,263 条表达降低。(第二军医大学学报,2000,21(9):827-830) 2、基因芯片对 PMA 激活的血管内皮细胞早期反应基因的研究 吴超群,李瑶,毛裕民, 等. 摘要:用含 4096 条人类基因的 DNA 芯片研究 PMA 激活的血管内皮细胞 ERG 的表达谱, 作用 6h 后,17 条基因表达上调,11 条基因下调。数据分析表明 17 条上调基因中 13 条属于 蛋白质磷酸酶和转录调控因子基因,而下调基因中 9 条为细胞分裂相关蛋白,从而证明 PMA 激活的人血管内皮细胞 ERG 主要是转录调控因子基因和蛋白质磷酸酶基因。 四、基因芯片在肿瘤研究中的应用
1、)寻找肿瘤相关基因 elford等结合消减杂交技术用基因芯片分析了两例具有不同生物学活性的Ewing肉 痘标 例为生长迅速的转移灶,另 一例为被成功治愈的局限, 经差异表达后,将消 插入质粒,制成cDNA ,文库,与不同荧光标记的肉瘤组织杂交,共得到173条差异表达的基因 其中有50条为新基因(28.9%). 2、种南基因表状普研究 Kon0nen等用含有4000条已知某因和2000个EST的cDNA芯片对两株分别为激素依 CWR2)和非微素依载 细胞迷 杂交,将其表达谱与269例前列腺 癌组织 正常前列腺组织 找设现片器吸系因中有3条西0注非微瓷 中表达超过2倍,有135条基因(2.6%下调超过50%其中上调的IGFBP2和HSP27基因在临 床激素抵抗复发肿瘤标本中分别有100%和31%也是上调的。 3、瘤分子生物学研究 Aiz3dh签用基因片对DBd B-cell lymph 1)进行的病理分型研究 发现,依据基因表达差异.DLBCL还可以分为三个亚型.(Narc,200,403503-5D 4、肼霜诊圈 国外有一个病人临床表现出典型的白血病症状,但形态学检测不典型,根据相关检查 诊断为AML(acute myeloid leukaemia),治疗几个月后未见好转。后来用DNA芯片与 高,从而确诊为肺泡弹状肌肉瘤, 改变治疗方案,病情出现缓解 五、基因款片在药物研究中的应用 1、药物筛选 直接检测化合物对生物大分子如受体、酶、离子通道等的结合及作用:检测化合物作用 于细胞后基因表达变化:选择合适的药物作用靶标 有人用5,766个基因的芯片分析正常与癌变的卵巢组织的mRNA,发现二者有30%的基因 表达差异为2倍以上,其中癌变组织9%的基因表达上调,尤以CD9、上皮糖蛋白、P27蛋白 2、指导合理用药 不同个体结合药物的靶标存在差异:小分子药物在体内的作用靶标不可能有绝对专 性。 六、基因芯片在微生物菌种鉴定中的应用 菌种鉴定、细菌基因分型及菌种鉴定、监测细菌抗药性基因 七、基因芯片在病原体致病机制中应用 1、致病机制研究 研究病原体基因组,了解其致病基因,抗药机制及抗药基因等:分析药物作用下病原体基因 表达情况:监测宿主在染病状态下基因表达的变化。 2、病原体致病机制的研究 1996年K0 l等首次用基因芯片技术发现ⅢV1包膜B蛋白酶极其多变,其中许多氨 基酸的改变与抗蛋白酶抑制剂的抗药性有关。 八、基因芯片在军事司法方面的应用
1、)寻找肿瘤相关基因 Welford 等结合消减杂交技术,用基因芯片分析了两例具有不同生物学活性的 Ewing 肉 瘤标本,一例为生长迅速的转移灶,另一例为被成功治愈的局限灶。经差异表达后,将消减文库 插入质粒,制成 cDNA 文库,与不同荧光标记的肉瘤组织杂交,共得到 173 条差异表达的基因, 其中有 50 条为新基因(28.9%)。 2、肿瘤基因表达谱研究 Kononen 等用含有 4000 条已知基因和 2000 个 EST 的 cDNA 芯片对两株分别为激素依 赖(CWR22)和非激素依赖(CWR22R)的前列腺癌细胞进行杂交,将其表达谱与 269 例前列腺 癌组织及正常前列腺组织比较,发现在芯片的 5148 条基因中,有3 条基因(0.7%)在非激素依赖 中表达超过 2 倍,有 135 条基因(2.6%)下调超过 50%,其中上调的 IGFBP2 和 HSP27 基因在临 床激素抵抗复发肿瘤标本中分别有 100% 和 31%也是上调的。 3、瘤分子生物学研究 Alizadeh 等用基因芯片对 DLBCL(diffuse large B-cell lymphoma )进行的病理分型研究 发现,依据基因表达差异,DLBCL 还可以分为三个亚型.(Nature, 2000,403:503-511)。 4、肿瘤诊断 国外有一个病人临床表现出典型的白血病症状,但形态学检测不典型,根据相关检查, 诊断为 AML (acute myeloid leukaemia) ,治疗几个月后未见好转。后来用 DNA 芯片与 病人骨髓的 mRNA 杂交,结果显示 AML 和 ALL(acute lymphoblastic leukaemia)基因都表达 较低,而在数据分析中发现,编码原肌球蛋白的基因表达极高,从而确诊为肺泡弹状肌肉瘤, 改变治疗方案,病情出现缓解。 五、基因芯片在药物研究中的应用 1、药物筛选 直接检测化合物对生物大分子如受体、酶、离子通道等的结合及作用;检测化合物作用 于细胞后基因表达变化;选择合适的药物作用靶标。 有人用 5,766 个基因的芯片分析正常与癌变的卵巢组织的 mRNA,发现二者有 30%的基因 表达差异为 2 倍以上,其中癌变组织 9%的基因表达上调,尤以 CD9、上皮糖蛋白、P27 蛋白 等。 2、指导合理用药 不同个体结合药物的靶标存在差异;小分子药物在体内的作用靶标不可能有绝对专一 性。 六、基因芯片在微生物菌种鉴定中的应用 菌种鉴定、细菌基因分型及菌种鉴定、监测细菌抗药性基因 七、基因芯片在病原体致病机制中应用 1、致病机制研究 研究病原体基因组,了解其致病基因,抗药机制及抗药基因等;分析药物作用下病原体基因 表达情况;监测宿主在染病状态下基因表达的变化。 2、病原体致病机制的研究 1996 年 Kozal 等首次用基因芯片技术发现 HIV-1 包膜 B 蛋白酶极其多变,其中许多氨 基酸的改变与抗蛋白酶抑制剂的抗药性有关。 八、基因芯片在军事司法方面的应用
检测生物战病原体,研制生物战保护剂:DNA指纹鉴定、血型鉴。 I)DNA指纹 DNA fingerprint:人类基因组内散布者许多串联重复的短小DNA序列,叫小卫星DN (MSDNA),由于不受选择压力,卫星DNA呈现高度的多态性,具有孟德尔式稳定遗传的 特性。因此,用MSDNA探针与总DNA限制性酶切片段(酶切位点在MSDNA之外)杂交, 可以得到个体特异的DNA指纹图谱。 第五节数据分析 1.图象分析(Image analysis) 2.标准化处理(Normalization):是指以持(管)家基因(housekeeping gene)的表达率为参 照,对原始数据进行校正的过程。实际操作中常常剔除Cy3和Cy5信号强度均小于40的 基因表达,使数据标准化。 3.散点图分析(scatter plot) 基因芯片的扫描示意图、基因芯片扫描结果图 4 Ratio值分析Ratio=Cv3/Cv5.一般认为Ratio值在05-20范围内(即2倍以下)的基因 不存在显著表达差异,该范围之外的基因表达认为具有显著差异, 由干实哈件不同出域 值区间会根据可信度有所调整 5.聚类分析(Clustering):就是根据统计分析原理对具有相同统计行为的多个基因或样本进 行归类的分析方法,归为一类(簇)的基因或样本可能具有相似的功能或类型。 聚类示意图 第六节基因芯片的发展与展望 2003年HGP完成后,人们面临的问题是如何了解10万条基因中每一个基因的功能, 以及基因之间的相互关系等。从而行生出人类基因组多样性计别、环墙基因组学、肿扇基因 解剖学计划、药物基因组学等。基因芯片以其无可比拟的高信息量、高通量、高自动化和快 速准确的优势必将成为后基因组时代最重要最常用的技术,因此,它被誉为微缩芯片实 至(lab-in-a-chp)a 一、中药开发 中医药体系一直是在“整体观念,讲证施治理论指导下完善发展而成的,现代医学也正 是朝“整体观念,辨证施治的方向发展。因此,中医药里既有巨大的宝藏,又有无限的商机。 基因芯片为中医药的研究提供了平行、快速、高通量、多参数的研究手段和筛选方法, 大黄治疗糖尿病、全反式维甲酸、三氧化二砷治疗白血病 二、SNPs(single nucleotide polymorphisms 染色体的某个位点上存在单个碱基的变化如果在人群中的频率超过1%,则认为是单核 酸多本(sNp ,SNPs是近年来出现的第三代遗传标记。另两个是RFLP,MSDNA 途:1)基因连锁分析,用于基因作图和疾病基因定位:2)人群中寻找SNPs位点:3)检 测保守基因中的点突变:4)病例与对照间的相关分析等。 SNPs分析的前提是所研究基因的DNA序列必须是已知的
检测生物战病原体,研制生物战保护剂;DNA 指纹鉴定、血型鉴。 1) DNA 指纹 DNA fingerprint:人类基因组内散布着许多串联重复的短小 DNA 序列,叫小卫星 DNA (MSDNA),由于不受选择压力,卫星 DNA 呈现高度的多态性,具有孟德尔式稳定遗传的 特性。因此,用 MSDNA 探针与总 DNA 限制性酶切片段(酶切位点在 MSDNA 之外)杂交, 可以得到个体特异的 DNA 指纹图谱。 第五节 数据分析 1.图象分析(Image analysis) 2.标准化处理(Normalization): 是指以持(管)家基因(housekeeping gene)的表达率为参 照,对原始数据进行校正的过程。实际操作中常常剔除 Cy3 和 Cy5 信号强度均小于 400 的 基因表达,使数据标准化。 3.散点图分析(scatter plot) 基因芯片的扫描示意图、基因芯片扫描结果图 4.Ratio 值分析 Ratio=Cy3/Cy5, 一般认为 Ratio 值在 0.5-2.0 范围内(即 2 倍以下)的基因 不存在显著表达差异,该范围之外的基因表达认为具有显著差异,由于实验条件不同,此域 值区间会根据可信度有所调整。 5.聚类分析(Clustering ):就是根据统计分析原理对具有相同统计行为的多个基因或样本进 行归类的分析方法,归为一类(簇)的基因或样本可能具有相似的功能或类型。 聚类示意图 第六节 基因芯片的发展与展望 2003 年 HGP 完成后,人们面临的问题是如何了解 10 万条基因中每一个基因的功能, 以及基因之间的相互关系等,从而衍生出人类基因组多样性计划、环境基因组学、肿瘤基因 解剖学计划、药物基因组学等。基因芯片以其无可比拟的高信息量、高通量、高自动化和快 速准确的优势必将成为后基因组时代最重要最常用的技术,因此,它 被誉为“微缩芯片实验 室”(lab-in-a-chip)。 一、中药开发 中医药体系一直是在“整体观念,辨证施治”理论指导下完善发展而成的,现代医学也正 是朝“整体观念,辨证施治”的方向发展。因此,中医药里既有巨大的宝藏,又有无限的商机。 基因芯片为中医药的研究提供了平行、快速、高通量、多参数的研究手段和筛选方法。 大黄治疗糖尿病、全反式维甲酸、三氧化二砷治疗白血病 二、SNPs(single nucleotide polymorphisms) 染色体的某个位点上存在单个碱基的变化如果在人群中的频率超过 1%,则认为是单核 苷酸多态(SNPs)。SNPs 是近年来出现的第三代遗传标记。另两个是 RFLP,MSDNA;用 途:1)基因连锁分析,用于基因作图和疾病基因定位;2)人群中寻找 SNPs 位点;3)检 测保守基因中的点突变;4)病例与对照间的相关分析等。 SNPs 分析的前提是所研究基因的 DNA 序列必须是已知的