结构上一个重要特点。每个断裂基因中第一个外显子的上游和最末一 个外显子的下游,都有一段不被转录的非编码区,称为侧翼顺序 断裂基因结构中外显子-内含子的接头区是一高度保守的一致顺 序,称为外显子-内含子接头。这是形成断裂基因结构上又一个重要特 点。每一个内含子的两端具有广泛的同源性和互补性,5′端起始的 两个碱基是GT,3′端最后的两个碱基是AG,通常把这种接头形式 叫做GT-AG法则( GT-AG rule)。这两个顺序是高度保守的,在各 种真核生物基因的内含子中均相同。 、基因组的组成 人类基因组按DNA序列分类既有单拷贝序列,也有重复频率不 等的多拷贝序列 (一)单拷贝序列 又称非重复序列。在基因组中仅有单一拷贝或少数几个拷贝,单 拷贝序列的长度在800bp~1000之间,其中有些是编码细胞中各种 蛋白质和酶的结构基因。单拷贝或低拷贝DNA序列可占到人类基因 组的60%~70% (二)重复多拷贝序列 重复多拷贝序列有的较短,有的较长,分散地穿插于整个基因组, 这些重复DNA是通过变性、复性实验而被发现的,重复DNA的复性 速度较非重复DNA快。根据复性的速度,又可分为简单序列DNA和 中度重复DNA。 1.简单序列DNA简单序列DNA( simple-sequence DNA)以5bp、 10bp或20bp、200bp为一个重复单位,它们串联重复很多次,约占整 个基因组的10%~15%,大多数重复次数多(高度重复),长度可达 10bp,即为简单序列DNA或卫星DNA( satellite dna)。通过原位 分子杂交检测,已知简单序列的DNA大多数位于染色体的着丝粒或 染色体的臂和端粒区,进一步研究证明是位于染色体的异染色质区。 由15bp~100bp组成的重复单位(常富含GC),重复20~50次
结构上一个重要特点。每个断裂基因中第一个外显子的上游和最末一 个外显子的下游,都有一段不被转录的非编码区,称为侧翼顺序。 断裂基因结构中外显子-内含子的接头区是一高度保守的一致顺 序,称为外显子-内含子接头。这是形成断裂基因结构上又一个重要特 点。每一个内含子的两端具有广泛的同源性和互补性,5′端起始的 两个碱基是 GT,3′端最后的两个碱基是 AG,通常把这种接头形式 叫做 GT-AG 法则(GT-AG rule)。这两个顺序是高度保守的,在各 种真核生物基因的内含子中均相同。 二、基因组的组成 人类基因组按 DNA 序列分类既有单拷贝序列,也有重复频率不 等的多拷贝序列。 (一)单拷贝序列 又称非重复序列。在基因组中仅有单一拷贝或少数几个拷贝,单 拷贝序列的长度在 800bp~1000bp 之间,其中有些是编码细胞中各种 蛋白质和酶的结构基因。单拷贝或低拷贝 DNA 序列可占到人类基因 组的 60%~70%。 (二)重复多拷贝序列 重复多拷贝序列有的较短,有的较长,分散地穿插于整个基因组, 这些重复 DNA 是通过变性、复性实验而被发现的,重复 DNA 的复性 速度较非重复 DNA 快。根据复性的速度,又可分为简单序列 DNA 和 中度重复 DNA。 1.简单序列 DNA 简单序列 DNA(simple-sequence DNA)以 5bp、 10bp 或 20bp、200bp 为一个重复单位,它们串联重复很多次,约占整 个基因组的 10%~15%,大多数重复次数多(高度重复),长度可达 105bp,即为简单序列 DNA 或卫星 DNA(satellite DNA)。通过原位 分子杂交检测,已知简单序列的 DNA 大多数位于染色体的着丝粒或 染色体的臂和端粒区,进一步研究证明是位于染色体的异染色质区。 由 15bp~100bp 组成的重复单位(常富含 GC),重复 20~50 次
形成的kb~5kb的短DNA,叫做小卫星DNA( minisatellite dna), 又叫做可变数目串联重复( variable number of tandem repeats,VNTR), 比上述的卫星DNA(105bp)短。而在基因组的间隔序列和内含子等 非编码区内,广泛存在着与小卫星DNA相似的一类小重复单位,重 复序列为bp~6bp,称为微卫星DNA( microsatellite dNA)或STR 如(A)n/(T)n、(CA)n/(TG)n、(CT)n、(AG)n等。由 于这些微卫星DNA区域在人类基因组中出现的数目和频率不同,表 现为多态性,为人类遗传分析提供了大量的多态遗传标志,其多态信 息量大于 RFLPs,可用于基因定位、群体进化以及基因诊断等研究。 近年来在脆性ⅹ染色体综合征、脊髓小脑性共济失调等疾病中发现微 卫星DNA如(CAG)n、(CTG)n等的不稳定性,往往发生三核苷 酸重复扩增突变。 2.中度重复DNA和可动DNA因子中度重复DNA( intermediate repeat dnA)是以不同的量分布于整个基因组的不同部位。这些间隔 的DNA长度可短至100bp~500bp,称为短分散元件( short interspersed element),也可长达600bp~7000bp,称为长分散元件(long interspersed element),占整个基因组的25%~40% Ah家族( Alu family)是短分散元件典型的例子,是人类基因组 含量最丰富的中度重复顺序,占基因组总DNA含量的3%~6%,长 达300bp,在一个基因组中重复30万~50万次。在Ah序列内含有 个限制性内切酶AlI的特异性识别位点AGCT,因此这一序列称为 Ah序列,它可被AhI酶裂解为一个170bp和130bp的两个片段。研 究表明神经母细胞纤维瘤发生是由于NF1抑癌基因突变所致,发现 患者的1对NF1等位基因之一有一新的Ah序列,使这一NF1基因 失活,当另一个NF1基因发生突变后,遂造成肿瘤的发生。某些隐性 遗传病也是由于Al序列插入到外显子中,致使蛋白质编码区的结构 改变,出现临床症状。 KmⅠ家族( Kpn I family)是长分散元件的典型例子,是中度 重复顺序中仅次于Ah家族的第二大家族,用限制性内切酶KmnⅠ消 化,可分解成四个长度不等的片段,分别是12、1.5、18和19kb
形成的 lkb~5kb 的短 DNA,叫做小卫星 DNA(minisateliite DNA), 又叫做可变数目串联重复(variable number of tandem repeats,VNTR), 比上述的卫星 DNA(105bp)短。而在基因组的间隔序列和内含子等 非编码区内,广泛存在着与小卫星 DNA 相似的一类小重复单位,重 复序列为 lbp~6bp,称为微卫星 DNA(microsatellite DNA)或 STR, 如(A)n/(T)n、(CA)n/(TG)n、(CT)n、(AG)n 等。由 于这些微卫星 DNA 区域在人类基因组中出现的数目和频率不同,表 现为多态性,为人类遗传分析提供了大量的多态遗传标志,其多态信 息量大于 RFLPs,可用于基因定位、群体进化以及基因诊断等研究。 近年来在脆性 X 染色体综合征、脊髓小脑性共济失调等疾病中发现微 卫星 DNA 如(CAG)n、(CTG)n 等的不稳定性,往往发生三核苷 酸重复扩增突变。 2.中度重复DNA和可动DNA 因子 中度重复DNA(intermediate repeat DNA)是以不同的量分布于整个基因组的不同部位。这些间隔 的 DNA 长度可短至100bp~500bp,称为短分散元件(short interspersed element),也可长达 6000bp ~7000bp ,称为长分散元件(long interspersed element),占整个基因组的 25%~40%。 Alu 家族(Alu family)是短分散元件典型的例子,是人类基因组 含量最丰富的中度重复顺序,占基因组总 DNA 含量的 3%~6%,长 达 300bp,在一个基因组中重复 30 万~50 万次。在 Alu 序列内含有一 个限制性内切酶 AluⅠ的特异性识别位点 AGCT,因此这一序列称为 Alu 序列,它可被 AluⅠ酶裂解为一个 170bp 和 130bp 的两个片段。研 究表明神经母细胞纤维瘤发生是由于 NF1 抑癌基因突变所致,发现一 患者的 1 对 NF1 等位基因之一有一新的 Alu 序列,使这一 NF1 基因 失活,当另一个 NF1 基因发生突变后,遂造成肿瘤的发生。某些隐性 遗传病也是由于 Alu 序列插入到外显子中,致使蛋白质编码区的结构 改变,出现临床症状。 KpnⅠ家族(KpnⅠ family)是长分散元件的典型例子,是中度 重复顺序中仅次于 Alu 家族的第二大家族,用限制性内切酶 KpnⅠ消 化,可分解成四个长度不等的片段,分别是 1.2、1.5、1.8 和 1.9kb