第五章人类悬园纽纽成及意达 学大铜要桌 1、掌握人类基因组组成 2、掌握人类基因结构 3、掌握人类基因的转录 4、了解人类基因表达调控 重点、A点介绍 人类基因结构 基因是具有生物学功能的核酸分子片段,是遗传物质突变、重组和具有特定遗传功能的 基本单位,是遗传信息传递、表达和生物性状形成的基础 大多数真核生物基因的编码序列不是连续排列的,被非编码序列隔开,因此,称为断裂 基因( split gene) 1、外显子(exon)与内含子( intron) 1)外显子:出现在成熟皿RNA中的基因序列,外显子序列可以是编码氨基酸的编码序列 也可以是非编码序列,如存在于起始密码之前和终止密码之后的外显子序列,这些序列出现 在成熟mRNA中,但并不编码氨基酸,所以称为非翻译区( untranslated region,UTR),在 基因3’端非翻译区内存在RNA加尾信号,其序列为5’- AATAAA-3’。 2)内含子:位于两外显子之间的序列 2、外显子内含子接头序列:在外显子与内含子接头有一段高度保守的序列,是RNA剪 接的信号,称为接头序列。每个内含子的5’端以GT开始,在3’端以AG结束,所以又称 为GT-AG法则。 3、侧翼序列( flanking sequences):在基因的两侧不被转录的非编码序列,这些序列 在转录调控中起重要作用。它们包括位于转录起始点上游的启动子序列、位于转录终止点下 游的终止子序列和位置不固定的转录调控序列,如增强子、静止子等。 1)启动子( promoters):是一段特异的核苷酸序列,通常位于基因转录起始点上游的 100bp范围,是RNA聚合酶的结合部位,能启动和促进转录过程。启动子决定了双链DNA中 的转录链,常见序列有 TATA框( TATA box):位于转录起始点上游大约-20~-30bp处,是高度保守的一段序列, 由7个碱基组成,即TATA(T)A(T),其中只有两个碱基可以有变化。TATA框能够与转 录因子TFⅡ结合,再与RNA聚合酶Ⅱ形成复合物,从而准确地识别转录的起始位置,对于 转录水平有着定量效应。 CAT框( CAat box):位于转录起始点上游-70~-80bp,也是一段保守序列,由9个碱 基组成,其序列为GGC(T) CAATCA,其中只有一个碱基可以变化。转录因子CTF能够识别 CAT框并且与之结合,其C端有着激活转录的功能。所以CAT框有促进转录的功能 GC框( gC box):其顺序为GCG,有两个拷贝,位于CAT框两侧。转录因子Sp1能 识别GC框并且与之结合,其N端有激活转录的作用。所以,GC框有激活转录的功能。 2)增强子( enhancer):增强子能增强启动子发动转录的作用,从而明显地提高基因转 录的效率。增强子的位置不固定,可以位于启动子上游,也可以位于启动子下游,可以距离 启动子很远,也可以距离启动子较近。 3)终止子( terminator):终止子为反向重复序列,是RNMA聚合酶停止工作的信号,反 向重复序列转录后,可以形成发夹式结构,并且形成一串U。发夹式结构阻碍了RNA聚合酶 的移动,一串U的U与DNA模板中的A结合不稳定,从模板上脱落下来,转录终止 综上所述,人类基因结构可图示如下: 15
15 第五章 人类基因组组成及表达 ⚫ 教学大纲要求 1、掌握人类基因组组成 2、掌握人类基因结构 3、掌握人类基因的转录 4、了解人类基因表达调控 ⚫ 重点、难点介绍 一、人类基因结构 基因是具有生物学功能的核酸分子片段,是遗传物质突变、重组和具有特定遗传功能的 基本单位,是遗传信息传递、表达和生物性状形成的基础。 大多数真核生物基因的编码序列不是连续排列的,被非编码序列隔开,因此,称为断裂 基因(split gene)。 1、 外显子(exon)与内含子(intron) 1)外显子:出现在成熟 mRNA 中的基因序列,外显子序列可以是编码氨基酸的编码序列, 也可以是非编码序列,如存在于起始密码之前和终止密码之后的外显子序列,这些序列出现 在成熟 mRNA 中,但并不编码氨基酸,所以称为非翻译区(untranslated region,UTR),在 基因 3’端非翻译区内存在 RNA 加尾信号,其序列为 5’-AATAAA-3’。 2)内含子:位于两外显子之间的序列。 2、外显子内含子接头序列:在外显子与内含子接头有一段高度保守的序列,是 RNA 剪 接的信号,称为接头序列。每个内含子的 5’端以 GT 开始,在 3’端以 AG 结束,所以又称 为 GT-AG 法则。 3、侧翼序列(flanking sequences):在基因的两侧不被转录的非编码序列,这些序列 在转录调控中起重要作用。它们包括位于转录起始点上游的启动子序列、位于转录终止点下 游的终止子序列和位置不固定的转录调控序列,如增强子、静止子等。 1)启动子(promoters):是一段特异的核苷酸序列,通常位于基因转录起始点上游的 100bp 范围,是 RNA 聚合酶的结合部位,能启动和促进转录过程。启动子决定了双链 DNA 中 的转录链,常见序列有: TATA 框(TATA box):位于转录起始点上游大约-20~-30bp 处,是高度保守的一段序列, 由 7 个碱基组成,即 TATAA(T)AA(T),其中只有两个碱基可以有变化。TATA 框能够与转 录因子 TFⅡ结合,再与 RNA 聚合酶Ⅱ形成复合物,从而准确地识别转录的起始位置,对于 转录水平有着定量效应。 CAAT 框(CAAT box):位于转录起始点上游-70~-80bp,也是一段保守序列,由 9 个碱 基组成,其序列为 GGC(T)CAATCA,其中只有一个碱基可以变化。转录因子 CTF 能够识别 CAAT 框并且与之结合,其 C 端有着激活转录的功能。所以 CAAT 框有促进转录的功能。 GC 框(GC box):其顺序为 GGCGGG,有两个拷贝,位于 CAAT 框两侧。转录因子 Sp1 能 识别 GC 框并且与之结合,其 N 端有激活转录的作用。所以,GC 框有激活转录的功能。 2)增强子(enhancer):增强子能增强启动子发动转录的作用,从而明显地提高基因转 录的效率。增强子的位置不固定,可以位于启动子上游,也可以位于启动子下游,可以距离 启动子很远,也可以距离启动子较近。 3)终止子(terminator):终止子为反向重复序列,是 RNA 聚合酶停止工作的信号,反 向重复序列转录后,可以形成发夹式结构,并且形成一串 U。发夹式结构阻碍了 RNA 聚合酶 的移动,一串 U 的 U 与 DNA 模板中的 A 结合不稳定,从模板上脱落下来,转录终止。 综上所述,人类基因结构可图示如下:
Exonl Exon2 Exon3 非翻译区 侧翼序列 二、人类基因组组成 基因组( genome)是细胞内全部遗传物质的总称。细胞内遗传物质包括存在于细胞核内 的全部DNA和存在于线粒体内的DNA,前者称为核基因组( nuclear genome),后者称为线 粒体基因组( mi tochondrial genome)。 (一)核基因组的组成 1、组成基因组的DNA序列:核基因组包括3×10°bp,约含3-5万基因。根据DNA出现 的拷贝数可以将组成基因组的DNA序列分为三类 1)单一序列( unique sequences):在一个基因组中只出现一次或很少几次,约占基因 组DNA的60%,大多数结构基因属于单一序列; 2)高度重复序列( highly repetitive sequences):约占基因组DNA的10%,重复单 位的长度小于200bp,在基因组中出现的拷贝数在10°-10°,如组成端粒和着丝粒的序列属于 高度重复序列 3)中度重复序列( moderately repetitive sequences):约占基因组DNA的30%,重 复单位的长度在200bp以上,在基因组的拷贝数在102-10°,少数基因属于中度重复序列。 2、多基因家族( multigene family):指由一个祖先基因经过重复和突变所形成的一组 基因,其中至少有一个功能基因。多基因家族有两类:一类串联排列在同一条染色体上,称 为基因簇( gene cluster),如a基因簇;另一类是不同成员分布在不同染色体上。 3、假基因( pseudogenes):多基因家族中不能产生有功能的基因产物的成员,它们与 功能基因同源,因突变而失去活性 4、人类核基因组组成 编码序列 基因及 基因相 内含子, 关序列 非翻译区, (30%) 侧翼序列 非编码序列 核基因组(3×10°bp) (90%)bp) 假基因 单一序列 (80%) 基因外序 列(70%) 重复序列
16 二、人类基因组组成 基因组(genome)是细胞内全部遗传物质的总称。细胞内遗传物质包括存在于细胞核内 的全部 DNA 和存在于线粒体内的 DNA,前者称为核基因组(nuclear genome),后者称为线 粒体基因组(mitochondrial genome)。 (一)核基因组的组成: 1、组成基因组的 DNA 序列:核基因组包括 3×109 bp,约含 3-5 万基因。根据 DNA 出现 的拷贝数可以将组成基因组的 DNA 序列分为三类: 1)单一序列(unique sequences):在一个基因组中只出现一次或很少几次,约占基因 组 DNA 的 60%,大多数结构基因属于单一序列; 2)高度重复序列(highly repetitive sequences):约占基因组 DNA 的 10%,重复单 位的长度小于 200bp,在基因组中出现的拷贝数在 106 -108,如组成端粒和着丝粒的序列属于 高度重复序列; 3)中度重复序列(moderately repetitive sequences):约占基因组 DNA 的 30%,重 复单位的长度在 200bp 以上,在基因组的拷贝数在 102 -105,少数基因属于中度重复序列。 2、多基因家族(multigene family):指由一个祖先基因经过重复和突变所形成的一组 基因,其中至少有一个功能基因。多基因家族有两类:一类串联排列在同一条染色体上,称 为基因簇(gene cluster),如α基因簇;另一类是不同成员分布在不同染色体上。 3、假基因(pseudogenes):多基因家族中不能产生有功能的基因产物的成员,它们与 功能基因同源,因突变而失去活性。 4、人类核基因组组成: GT AG GT AG Intron 2 Exon1 Exon2 Exon3 Intron 1 非翻译区 侧翼序列 核基因组(3×109 bp) 基因及 基因相 关序列 (30%) 编码序列 (10%) 非编码序列 (90%)9 bp) 内含子, 非翻译区, 侧翼序列 假基因 基因外序 列(70%) 单一序列 (80%) 重复序列 (20%)
由以上分析可见,核基因组中编码序列只占基因组DNA的3%。 (二)线粒体基因组( mitochondrial genome) 1、为环状DNA,长度为16569bp,双链DNA中,富含G的称为重链(he eave chal 富含C的为轻链( light chain,L) 2、能自主复制,在细胞内具有多拷贝 3、编码序列占93%,编码37个基因,其中13个编码蛋白质基因,2个rRM基因和22 个tRNA基因:28个基因由重链编码,9个基因由轻链编码 4、基因内无内含子,基因排列紧凑,基因之间间隔极短或无间隔,有些甚至重叠 5、部分密码子不同于核基因组密码子。 三、基因表达( gene expression): 储存在DNA中的遗传信息通过在细胞核内转录( transcription)形成mRNA,并由mRNA 在细胞质内经过翻译( translation)转变成具有生物活性的蛋白质分子的过程,称为基因 表达 (一)转录( transcription): 在细胞核内,以DNA链为模板合成mRNA的过程称为转录。在双链DNA中,做为转录模 板的DNA单链称为模板链( template strand)或反义链(anti- sense strand),不作为模 板的DNA单链称为非模板链或有义链( sense strand)。双链DNA解旋后,RNA聚合酶沿着 DNA模板移动,到达转录起始点后,即开始合成RMA。DNA转录后的初级产物为 hnRNA ( heterogenious nuclear rNA),初级产物需要经过加工后成为成熟的mRNA。加工过程包 括 1、加帽:在RNA的5′端接上一个甲基化帽,即7-甲基鸟嘌呤核苷酸。 2、剪接:是指在酶的作用下,将初级RNA中的内含子序列切掉,并将各外显子序列拼 接起来 3、加尾:在腺苷酸聚合酶的作用下,在RNA的3’端加接一连串腺苷酸,形成多聚腺 苷酸( poly a)尾。 转录过程图示如下: Intron 1 Intron 2 Exon1 Exon3 转录 hnRNA 加工 mRNA AAAAAA…AA (二)翻译( translation): 在细胞质中,以mRNA为模板,tRNA为运载工具,将活化氨基酸在核糖体上装配成多肽 链的过程,多肽链经过修饰加工成为有生物学活性的蛋白质。 (三)人类基因表达调控: 如前所述,每个体细胞内都含有全部基因,但各种类型的细胞行使不同的功能,这是通
17 由以上分析可见,核基因组中编码序列只占基因组 DNA 的 3%。 (二)线粒体基因组(mitochondrial genome) 1、为环状 DNA,长度为 16569bp,双链 DNA 中,富含 G 的称为重链(heavy chain,H), 富含 C 的为轻链(light chain,L); 2、能自主复制,在细胞内具有多拷贝; 3、编码序列占 93%,编码 37 个基因,其中 13 个编码蛋白质基因,2 个 rRNA 基因和 22 个 tRNA 基因;28 个基因由重链编码,9 个基因由轻链编码; 4、基因内无内含子,基因排列紧凑,基因之间间隔极短或无间隔,有些甚至重叠; 5、部分密码子不同于核基因组密码子。 三、基因表达(gene expression): 储存在 DNA 中的遗传信息通过在细胞核内转录(transcription)形成 mRNA,并由 mRNA 在细胞质内经过翻译(translation)转变成具有生物活性的蛋白质分子的过程,称为基因 表达。 (一)转录(transcription): 在细胞核内,以 DNA 链为模板合成 mRNA 的过程称为转录。在双链 DNA 中,做为转录模 板的 DNA 单链称为模板链(template strand)或反义链(anti-sense strand),不作为模 板的 DNA 单链称为非模板链或有义链(sense strand)。双链 DNA 解旋后,RNA 聚合酶沿着 DNA 模板移动,到达转录起始点后,即开始合成 RNA。DNA 转录后的初级产物为 hnRNA (heterogenious nuclear RNA),初级产物需要经过加工后成为成熟的 mRNA。加工过程包 括: 1、加帽:在 RNA 的 5’端接上一个甲基化帽,即 7-甲基鸟嘌呤核苷酸。 2、剪接:是指在酶的作用下,将初级 RNA 中的内含子序列切掉,并将各外显子序列拼 接起来; 3、加尾:在腺苷酸聚合酶的作用下,在 RNA 的 3’端加接一连串腺苷酸,形成多聚腺 苷酸(poly A)尾。 转录过程图示如下: (二)翻译(translation): 在细胞质中,以 mRNA 为模板,tRNA 为运载工具,将活化氨基酸在核糖体上装配成多肽 链的过程,多肽链经过修饰加工成为有生物学活性的蛋白质。 (三)人类基因表达调控: 如前所述,每个体细胞内都含有全部基因,但各种类型的细胞行使不同的功能,这是通 加工 AAAAAA…AA GT AG GT AG Intron 2 Exon1 Exon2 Exon3 Intron 1 转录 hnRNA mRNA
过控制不同基因在特定时期表达来实现的。因而,人类基因表达的调控是一个非常复杂的问 题,基因表达调控可以在不同水平来进行: 1、转录前调控:组蛋白与DNA结合后,可以抑制基因表达。非组蛋白可以解除组蛋白 对DNA转录的抑制,促进DMA转录,是转录前调控的重要方式。 2、转录水平调控:是人类基因表达调控的关键,可以通过启动子、增强子等特异序列 与相应的蛋白质结合激活或抑制转录过程而到达调控基因表达的目的。 3、转录后调控:主要是初级RNA加工过程受到调控。通过不同的加工可以由一个基因 的转录产物产生出不同的成熟mRNA,从而翻译出不同的蛋白质 4、翻译水平调控:核糖体数量、皿RNA的成熟度、启动因子、延伸因子、释放因子和各 种酶等均能影响蛋白质合成 5、翻译后调控:多肽链合成后要通过修饰、加工,才能成为具有一定生物活性的蛋白 质 18
18 过控制不同基因在特定时期表达来实现的。因而,人类基因表达的调控是一个非常复杂的问 题,基因表达调控可以在不同水平来进行: 1、转录前调控:组蛋白与 DNA 结合后,可以抑制基因表达。非组蛋白可以解除组蛋白 对 DNA 转录的抑制,促进 DNA 转录,是转录前调控的重要方式。 2、转录水平调控:是人类基因表达调控的关键,可以通过启动子、增强子等特异序列 与相应的蛋白质结合激活或抑制转录过程而到达调控基因表达的目的。 3、转录后调控:主要是初级 RNA 加工过程受到调控。通过不同的加工可以由一个基因 的转录产物产生出不同的成熟 mRNA,从而翻译出不同的蛋白质。 4、翻译水平调控:核糖体数量、mRNA 的成熟度、启动因子、延伸因子、释放因子和各 种酶等均能影响蛋白质合成。 5、翻译后调控:多肽链合成后要通过修饰、加工,才能成为具有一定生物活性的蛋白 质