患者具有体矮和其它性腺发育不全的体征。根据X染色体失活原则,如果导致性腺发育不全的基因为可失活基因,以上核型的个体的表现型可能相同,因此认为导致性腺发育不全的基因为逃脱失活基因。通过比较不同46,XY患者Y染色体缺失情况和性腺发育不全表型,在X染色体短臂上克隆出一个导致性腺发育不全综合征的基因一RPS4X,该基因编码一个高度保守的40S核糖体S4蛋白。当然从X长臂缺失可导致出现一些性腺发育不全症状的事实说明X染色体长臂上也存在与性腺发育有关的基因。3、XYY综合征4、XXX综合征5、脆性X染色体综合征6、两性畸形15
15 患者具有体矮和其它性腺发育不全的体征。根据 X 染色体失活原则,如果导致性腺发育不 全的基因为可失活基因,以上核型的个体的表现型可能相同,因此认为导致性腺发育不全的 基因为逃脱失活基因。通过比较不同 46,XY 患者 Y 染色体缺失情况和性腺发育不全表型, 在 X 染色体短臂上克隆出一个导致性腺发育不全综合征的基因—RPS4X,该基因编码一个 高度保守的 40S 核糖体 S4 蛋白。当然从 X 长臂缺失可导致出现一些性腺发育不全症状的事 实说明 X 染色体长臂上也存在与性腺发育有关的基因。 3、XYY 综合征 4、XXX 综合征 5、脆性 X 染色体综合征 6、两性畸形
第五章人类基园组组成及表达教学大细要来1、掌握人类基因组组成2、掌握人类基因结构3、掌握人类基因表达及调控·重点、难点介绍一、人类基因组组成基因组(genome)是细胞内全部遗传物质的总称。人类基因组指人体细胞内全部DNA序列,包含人的所有遗传信息,由核基因组(nucleargenome)和线粒体基因组(mitochrondrialgenome)组成。细胞内遗传物质包括存在于细胞核内的全部DNA和存在于线粒体内的DNA,前者称为核基因组,后者称为线粒体基因组。(一)核基因组的组成:1、组成基因组的DNA序列:核基因组包括3×10bp,最新统计和预测大约有2.3万个蛋白质编码基因,6000多个RNA基因和1.2万个假基因。根据DNA出现的拷贝数可以将组成基因组的DNA序列分为三类:1)单一序列(uniquesequences):在一个基因组中只出现一次或很少几次,约占基因组DNA的60%,大多数结构基因属于单一序列:2)高度重复序列(highlyrepetitivesequences):约占基因组DNA的10%,重复单位的长度小于200bp,在基因组中出现的拷贝数在10-10,如组成端粒和着丝粒的序列属于高度重复序列:3)中度重复序列(moderatelyrepetitivesequences):约占基因组DNA的30%,重复单位的长度在200bp以上,在基因组的拷贝数在10°-105,少数基因属于中度重复序列。2、多基因家族(multigenefamily):指由一个祖先基因经过重复和突变所形成的一组基因,其中至少有一个功能基因。多基因家族有两类:一类串联排列在同一条染色体上,称为基因簇(genecluster),如a基因簇;另一类是不同成员分布在不同染色体上。3、假基因(pseudogenes):多基因家族中不能产生有功能的基因产物的成员,它们与功能基因同源,因突变而失去活性。4、人类核基因组组成:编码序列(10%)基因及内含子,基因相非翻译区,关序列侧翼序列(30%)非编码序列核基因组(3×10bp)(90%)bp)假基因单一序列(80%)基因外序列(70%)(二)线粒体基因组(mitochondrialgenon重复序列1、为环状DNA,长度为16569bp,双链DNA中为重链(heavychain,H),(20%)富含C的为轻链(lightchain,L);1 6
16 第五章 人类基因组组成及表达 ⚫ 教学大纲要求 1、掌握人类基因组组成 2、掌握人类基因结构 3、掌握人类基因表达及调控 ⚫ 重点、难点介绍 一、人类基因组组成 基因组(genome)是细胞内全部遗传物质的总称。人类基因组指人体细胞内全部 DNA 序 列,包含人的所有遗传信息,由核基因组(nuclear genome)和线粒体基因组(mitochrondrial genome)组成。细胞内遗传物质包括存在于细胞核内的全部 DNA 和存在于线粒体内的 DNA, 前者称为核基因组,后者称为线粒体基因组。 (一)核基因组的组成: 1、组成基因组的 DNA 序列:核基因组包括 3×109 bp,最新统计和预测大约有 2.3 万个 蛋白质编码基因,6000 多个 RNA 基因和 1.2 万个假基因。根据 DNA 出现的拷贝数可以将组 成基因组的 DNA 序列分为三类: 1)单一序列(unique sequences):在一个基因组中只出现一次或很少几次,约占基因 组 DNA 的 60%,大多数结构基因属于单一序列; 2)高度重复序列(highly repetitive sequences):约占基因组 DNA 的 10%,重复单 位的长度小于 200bp,在基因组中出现的拷贝数在 106 -108,如组成端粒和着丝粒的序列属于 高度重复序列; 3)中度重复序列(moderately repetitive sequences):约占基因组 DNA 的 30%,重 复单位的长度在 200bp 以上,在基因组的拷贝数在 102 -105,少数基因属于中度重复序列。 2、多基因家族(multigene family):指由一个祖先基因经过重复和突变所形成的一组 基因,其中至少有一个功能基因。多基因家族有两类:一类串联排列在同一条染色体上,称 为基因簇(gene cluster),如α基因簇;另一类是不同成员分布在不同染色体上。 3、假基因(pseudogenes):多基因家族中不能产生有功能的基因产物的成员,它们与 功能基因同源,因突变而失去活性。 4、人类核基因组组成: (二)线粒体基因组(mitochondrial genome) 1、为环状 DNA,长度为 16569bp,双链 DNA 中,富含 G 的称为重链(heavy chain,H), 富含 C 的为轻链(light chain,L); 核基因组(3×109 bp) 基因及 基因相 关序列 (30%) 编码序列 (10%) 非编码序列 (90%)9 bp) 内含子, 非翻译区, 侧翼序列 假基因 基因外序 列(70%) 单一序列 (80%) 重复序列 (20%)
2、能自主复制,在细胞内具有多拷贝;3、编码序列占93%,编码37个基因,其中13个编码蛋白质基因,2个rRNA基因和22个tRNA基因:28个基因由重链编码,9个基因由轻链编码:4、基因内无内含子,基因排列紧凑,基因之间间隔极短或无间隔,有些甚至重叠;5、部分密码子不同于核基因组密码子。二、人类基因结构基因是具有生物学功能的核酸分子片段,是遗传物质突变、重组和具有特定遗传功能的基本单位,是遗传信息传递、表达和生物性状形成的基础。大多数真核生物基因的编码序列不是连续排列的,被非编码序列隔开,因此,称为断裂基因(splitgene)。人类编码基因主要由外显子、内含子和侧翼序列组成。1、外显子(exon)与内含子(intron)1)外显子:出现在成熟mRNA中的基因序列,外显子序列可以是编码氨基酸的编码序列,也可以是非编码序列,如存在于起始密码之前和终止密码之后的外显子序列,这些序列出现在成熟mRNA中,但并不编码氨基酸,所以称为非翻译区(untranslatedregion,UTR),在基因3”端非翻译区内存在RNA加尾信号,其序列为5”-AATAAA-3。2)内含子:位于两外显子之间的序列。2、外显子内含子接头序列:在外显子与内含子接头有一段高度保守的序列,是RNA剪接的信号,称为接头序列。每个内含子的5端以GT开始,在3,端以AG结束,所以义称为GT-AG法则。3、侧翼序列(flankingsequences):在基因的两侧不被转录的非编码序列,这些序列在转录调控中起重要作用。它们包括位于转录起始点上游的启动子序列、位于转录终止点下游的终止子序列和位置不固定的转录调控序列,如增强子、沉默子等。1)启动子(promoters):是一段特异的核苷酸序列,通常位于基因转录起始点上游的10Obp范围,是RNA聚合酶的结合部位,能启动和促进转录过程。启动子决定了双链DNA中的转录链,常见序列有:TATA框(TATAbox):位于转录起始点上游大约-20~-30bp处,是高度保守的一段序列,由7个碱基组成,即TATAA(T)AA(T),其中只有两个碱基可以有变化。TATA框能够与转录因子TFIⅡI结合,再与RNA聚合酶II形成复合物,从而准确地识别转录的起始位置,对手转录水平有定量效应。CAAT框(CAATbox):位于转录起始点上游-70~-80bp,也是一段保守序列,由9个碱基组成,其序列为GGC(T)CAATCA,其中只有一个碱基可以变化。转录因子CTF能够识别CAAT框并且与之结合,其C端有着激活转录的功能。所以CAAT框有促进转录的功能。GC框(GCbox):其顺序为GGCGGG,有两个拷贝,位于CAAT框两侧。转录因子Sp1能识别GC框并且与之结合,其N端有激活转录的作用。所以,GC框有激活转录的功能。2)增强子(enhancer):增强子能增强启动子发动转录的作用,从而明显地提高基因转录的效率。增强子的位置不固定,可以位于启动子上游,也可以位于启动子下游,可以距离启动子很远,也可以距离启动子较近。3)沉默子(silencer):沉默子与增强子有许多相似的性质,但其功能是同反式抑制因子结合从而阻断增强子及反式激活因子的作用,并最终抑制基因的转录活性,属于负调控元件。4)终止子(terminator):终止子为反向重复序列,是RNA聚合酶停止工作的信号,反向重复序列转录后,可以形成发夹式结构,并且形成一串U。发夹式结构阻碍了RNA聚合酶的移动,一串U的U与DNA模板中的A结合不稳定,从模板上脱落下来,转录终止。17
17 2、能自主复制,在细胞内具有多拷贝; 3、编码序列占 93%,编码 37 个基因,其中 13 个编码蛋白质基因,2 个 rRNA 基因和 22 个 tRNA 基因;28 个基因由重链编码,9 个基因由轻链编码; 4、基因内无内含子,基因排列紧凑,基因之间间隔极短或无间隔,有些甚至重叠; 5、部分密码子不同于核基因组密码子。 二、人类基因结构 基因是具有生物学功能的核酸分子片段,是遗传物质突变、重组和具有特定遗传功能的 基本单位,是遗传信息传递、表达和生物性状形成的基础。 大多数真核生物基因的编码序列不是连续排列的,被非编码序列隔开,因此,称为断裂 基因(split gene)。人类编码基因主要由外显子、内含子和侧翼序列组成。 1、 外显子(exon)与内含子(intron) 1)外显子:出现在成熟 mRNA 中的基因序列,外显子序列可以是编码氨基酸的编码序列, 也可以是非编码序列,如存在于起始密码之前和终止密码之后的外显子序列,这些序列出现 在成熟 mRNA 中,但并不编码氨基酸,所以称为非翻译区(untranslated region,UTR),在 基因 3’端非翻译区内存在 RNA 加尾信号,其序列为 5’-AATAAA-3’。 2)内含子:位于两外显子之间的序列。 2、外显子内含子接头序列:在外显子与内含子接头有一段高度保守的序列,是 RNA 剪 接的信号,称为接头序列。每个内含子的 5’端以 GT 开始,在 3’端以 AG 结束,所以又称 为 GT-AG 法则。 3、侧翼序列(flanking sequences):在基因的两侧不被转录的非编码序列,这些序列 在转录调控中起重要作用。它们包括位于转录起始点上游的启动子序列、位于转录终止点下 游的终止子序列和位置不固定的转录调控序列,如增强子、沉默子等。 1)启动子(promoters):是一段特异的核苷酸序列,通常位于基因转录起始点上游的 100bp 范围,是 RNA 聚合酶的结合部位,能启动和促进转录过程。启动子决定了双链 DNA 中 的转录链,常见序列有: TATA 框(TATA box):位于转录起始点上游大约-20~-30bp 处,是高度保守的一段序 列,由 7 个碱基组成,即 TATAA(T)AA(T),其中只有两个碱基可以有变化。TATA 框能够 与转录因子 TFⅡ结合,再与 RNA 聚合酶Ⅱ形成复合物,从而准确地识别转录的起始位置, 对于转录水平有着定量效应。 CAAT 框(CAAT box):位于转录起始点上游-70~-80bp,也是一段保守序列,由 9 个碱 基组成,其序列为 GGC(T)CAATCA,其中只有一个碱基可以变化。转录因子 CTF 能够识别 CAAT 框并且与之结合,其 C 端有着激活转录的功能。所以 CAAT 框有促进转录的功能。 GC 框(GC box):其顺序为 GGCGGG,有两个拷贝,位于 CAAT 框两侧。转录因子 Sp1 能 识别 GC 框并且与之结合,其 N 端有激活转录的作用。所以,GC 框有激活转录的功能。 2)增强子(enhancer):增强子能增强启动子发动转录的作用,从而明显地提高基因转 录的效率。增强子的位置不固定,可以位于启动子上游,也可以位于启动子下游,可以距离 启动子很远,也可以距离启动子较近。 3)沉默子(silencer):沉默子与增强子有许多相似的性质,但其功能是同反式抑制因 子结合从而阻断增强子及反式激活因子的作用,并最终抑制基因的转录活性,属于负调控元 件。 4)终止子(terminator):终止子为反向重复序列,是 RNA 聚合酶停止工作的信号,反 向重复序列转录后,可以形成发夹式结构,并且形成一串 U。发夹式结构阻碍了 RNA 聚合酶 的移动,一串 U 的 U 与 DNA 模板中的 A 结合不稳定,从模板上脱落下来,转录终止
综上所述,人类基因结构可图示如下:Intron 1Intron 2GTAGAGGTExon1Exon2Exon3非翻译区侧翼序列三、基因表达(geneexpression):储存在DNA中的遗传信息通过在细胞核内转录(transcription)形成mRNA,并由mRNA在细胞质内经过翻译(translation)转变成具有生物活性的蛋白质分子的过程,称为基因表达。(一)转录(transcription):在细胞核内,以DNA链为模板合成mRNA的过程称为转录。在双链DNA中,做为转录模板的DNA单链称为模板链(templatestrand)或反义链(anti-sensestrand),不作为模板的DNA单链称为非模板链或有义链(sensestrand)。双链DNA解旋后,RNA聚合酶沿着DNA模板移动,到达转录起始点后,即开始合成RNA。DNA转录后的初级产物为hnRNA(heterogeniousnuclearRNA),初级产物需要经过加工后成为成熟的mRNA。加工过程包括:1、加帽:在RNA的5”端接上一个甲基化帽,即7-甲基鸟嘌呤核苷酸。2、剪接:是指在酶的作用下,将初级RNA中的内含子序列切掉,并将各外显子序列拼接起来:3、加尾:在腺苷酸聚合酶的作用下,在RNA的3'端加接一连串腺苷酸,形成多聚腺苷酸(polyA)尾。转录过程图示如下:Intron2Infron1AGAGGTGTFxonExon1Exon3转录hnRNAmRNAAAAAAA..-AA(二)翻译(translation):在细胞质中,以mRNA为模板,tRNA为运载工具,将活化氨基酸在核糖体上装配成多肽链的过程,多肽链经过修饰加工成为有生物学活性的蛋白质。1 8
18 综上所述,人类基因结构可图示如下: 三、基因表达(gene expression): 储存在 DNA 中的遗传信息通过在细胞核内转录(transcription)形成 mRNA,并由 mRNA 在细胞质内经过翻译(translation)转变成具有生物活性的蛋白质分子的过程,称为基因 表达。 (一)转录(transcription): 在细胞核内,以 DNA 链为模板合成 mRNA 的过程称为转录。在双链 DNA 中,做为转录模 板的 DNA 单链称为模板链(template strand)或反义链(anti-sense strand),不作为模 板的 DNA 单链称为非模板链或有义链(sense strand)。双链 DNA 解旋后,RNA 聚合酶沿着 DNA 模板移动,到达转录起始点后,即开始合成 RNA。DNA 转录后的初级产物为 hnRNA (heterogenious nuclear RNA),初级产物需要经过加工后成为成熟的 mRNA。加工过程包 括: 1、加帽:在 RNA 的 5’端接上一个甲基化帽,即 7-甲基鸟嘌呤核苷酸。 2、剪接:是指在酶的作用下,将初级 RNA 中的内含子序列切掉,并将各外显子序列拼 接起来; 3、加尾:在腺苷酸聚合酶的作用下,在 RNA 的 3’端加接一连串腺苷酸,形成多聚腺 苷酸(poly A)尾。 转录过程图示如下: (二)翻译(translation): 在细胞质中,以 mRNA 为模板,tRNA 为运载工具,将活化氨基酸在核糖体上装配成多肽 链的过程,多肽链经过修饰加工成为有生物学活性的蛋白质。 GT AG GT AG Intron 2 Exon1 Exon2 Exon3 Intron 1 非翻译区 侧翼序列 加工 AAAAAA.AA GT AG GT AG Intron 2 Exon1 Exon2 Exon3 Intron 1 转录 hnRNA mRNA
(三)人类基因表达调控:如前所述,每个体细胞内都含有全部基因,但各种类型的细胞行使不同的功能,这是通过控制不同基因在特定时期表达来实现的。因而,人类基因表达的调控是一个非常复杂的问题,基因表达调控可以在不同水平来进行:1、转录前调控:组蛋白与DNA结合后,可以抑制基因表达。非组蛋白可以解除组蛋白对DNA转录的抑制,促进DNA转录,是转录前调控的重要方式。2、转录水平调控:是人类基因表达调控的关键,可以通过启动子、增强子等特异序列与相应的蛋白质结合激活或抑制转录过程而到达调控基因表达的目的。各种因素(包括环境因素和遗传因素)可能通过不同途径永久地或可逆地调节基因的转录,例如信号分子、细胞内的激素核受体、细胞表面受体:最终都是介导转录因子特异性地结合基因的调控序列(又称顺式作用元件,cis-actingelement)调节基因的转录。3、转录后调控:主要是初级RNA加工过程受到调控。选择性剪接(alternativesplicing)是指同一种hnRNA由于加工不同,而产生出不同的mRNA和蛋白质。RNA编辑(RNAediting)也是改变mRNA序列的一种方式,是指对转录后的mRNA编码区进行碱基插入、删除或替换,以改变来源于DNA模板的遗传信息,翻译出不同于基因原编码的氨基酸序列的蛋白质。4、翻译水平调控:核糖体数量、mRNA的成熟度、启动因子、延伸因子、释放因子和各种酶等均能影响蛋白质合成。5、翻译后调控:多肽链合成后要通过修饰、加工,才能成为具有一定生物活性的蛋白质。第六章表观遗传学·教学大细要来1、了解表观遗传修饰1 9
19 (三)人类基因表达调控: 如前所述,每个体细胞内都含有全部基因,但各种类型的细胞行使不同的功能,这是通 过控制不同基因在特定时期表达来实现的。因而,人类基因表达的调控是一个非常复杂的问 题,基因表达调控可以在不同水平来进行: 1、转录前调控:组蛋白与 DNA 结合后,可以抑制基因表达。非组蛋白可以解除组蛋白 对 DNA 转录的抑制,促进 DNA 转录,是转录前调控的重要方式。 2、转录水平调控:是人类基因表达调控的关键,可以通过启动子、增强子等特异序列 与相应的蛋白质结合激活或抑制转录过程而到达调控基因表达的目的。各种因素(包括环境 因素和遗传因素)可能通过不同途径永久地或可逆地调节基因的转录,例如信号分子、细胞 内的激素核受体、细胞表面受体;最终都是介导转录因子特异性地结合基因的调控序列(又 称顺式作用元件,cis-acting element)调节基因的转录。 3、转录后调控:主要是初级RNA加工过程受到调控。选择性剪接(alternative splicing)是指同一种hnRNA由于加工不同,而产生出不同的mRNA 和蛋白质。RNA编辑 (RNA editing)也是改变mRNA序列的一种方式,是指对转录后的mRNA 编码区进行碱基 插入、删除或替换,以改变来源于DNA模板的遗传信息,翻译出不同于基因原编码的氨基 酸序列的蛋白质。 4、翻译水平调控:核糖体数量、mRNA 的成熟度、启动因子、延伸因子、释放因子和 各种酶等均能影响蛋白质合成。 5、翻译后调控:多肽链合成后要通过修饰、加工,才能成为具有一定生物活性的蛋白 质。 第六章 表观遗传学 ⚫ 教学大纲要求 1、了解表观遗传修饰