生物信息学课程基因组学概述Bioinformatics测序原理及方法通量特点仪器成本(S)测序成本($/Mbase)读长(bp)测序质量(Q30)HiSeq (NovaSeq XPlus)~100万~0.022x150每日~8Tb≥85%通量高、单Read成本低BGISEQ-T20~100万~0.012x150每小时900Gb≥80%成本效益高两种常用二代测序技术的比较6
6 生物信息学 课程 Bioinformatics 基因组学概述 测序原理及方法 两种常用二代测序技术的比较 仪器成本($) 测序成本($/Mbase) 读长(bp) 通量 测序质量(Q30) 特点 HiSeq (NovaSeq XPlus) ~100万 ~0.02 2x150 每日~8Tb ≥85% 通量高、单Read成本低 BGISEQ -T20 ~100万 ~0.01 2x150 每小时900Gb ≥80% 成本效益高
生物信息学课程基因组学概述Bioinformatics测序原理及方法ABPacBio三代测序Nanopore三代测序SDNA/RNAODNAsod马达蛋白四色荧光标记dNTPs纳米孔蛋白DNA案合MZMWL时间激发光荧光膜信号处理)记录电流信号变化N个孔,N个读段离子流.+...CTGATATTGCTT时间读长达20KbN个分子穿过孔,N个读段读长可达MbACGA三代测序技术原理示意图。(A)PacBio长读长测序法基本原理。(B)Nanopore长读长测序基本原理。7
生物信息学 课程 Bioinformatics 基因组学概述 测序原理及方法 三代测序技术原理示意图。(A)PacBio长读长测序法基本原理。(B)Nanopore长读长测序基本原理。 7
生物信息学课程基因组学概述Bioinformatics·一代、二代、三代PacBio测序技术的共同点在于基于在DNA复制中对掺入的A/C/G/T引入标记信号,通过不同的方法读出DNA序列:·一代测序技术通过按片段大小依次读出未端终止碱基;·二代测序技术并行、循环可逆地边合成边读取信号(掺入终止碱基/读取信号/去除终止基团和信号);:三代测序技术并行、以单分子实时读取掺入的碱基信号。它们的主要区别在于::一代测序技术通量最低、读长稍长于二代测序技术;·二代测序技术读长最短,但通量最大::三代测序技术读长最长,但通量低于二代测序技术。8
8 生物信息学 课程 Bioinformatics 基因组学概述 • 一代、二代、三代PacBio测序技术的共同点在于基于在DNA复制中对掺入的A/C/G/T引入标记信 号,通过不同的方法读出DNA序列: • 一代测序技术通过按片段大小依次读出末端终止碱基; • 二代测序技术并行、循环可逆地边合成边读取信号(掺入终止碱基/读取信号/去除终止基团 和信号); • 三代测序技术并行、以单分子实时读取掺入的碱基信号。 • 它们的主要区别在于: • 一代测序技术通量最低、读长稍长于二代测序技术; • 二代测序技术读长最短,但通量最大; • 三代测序技术读长最长,但通量低于二代测序技术
生物信息学课程基因组学概述Bioinformatics需求工具基因鉴定GENSCAN,GlimmerHMM重复DNA序列的鉴定RepeatMasker全基因组的多重比对PHAST,Multiz保守DNA元件的鉴定phastCons,Phylop二代测序读段与参考基因组的比对Bowtie、BWA、STAR比对文件的存储和解析SAMtoolsMACS2、PeakSeqChiP-seq的peak鉴定基因表达的定量Cuffinks差异表达的统计性检验edgeR,DESseq2可变剪接事件的鉴定和定量rMATS转录因子基序(Motif)的发现MEME、Homer染色体的突变鉴定GATK、VAAST染色质状态的鉴定ChromHMMPECA、ANANSE基因调控网络的解析常用工具及其作用9
9 生物信息学 课程 Bioinformatics 基因组学概述 需求 工具 基因鉴定 GENSCAN,GlimmerHMM 重复DNA序列的鉴定 RepeatMasker 全基因组的多重比对 PHAST,Multiz 保守DNA元件的鉴定 phastCons, PhyloP 二代测序读段与参考基因组的比对 Bowtie、BWA、STAR 比对文件的存储和解析 SAMtools ChIP-seq的peak鉴定 MACS2、PeakSeq 基因表达的定量 Cufflinks 差异表达的统计性检验 edgeR、DESseq2 可变剪接事件的鉴定和定量 rMATS 转录因子基序(Motif)的发现 MEME、Homer 染色体的突变鉴定 GATK、VAAST 染色质状态的鉴定 ChromHMM 基因调控网络的解析 PECA、ANANSE 常用工具及其作用
生物信息学课程基因组学概述Bioinformatics基因组学数据可视化·常见的基于网络的集成基因组浏览器包括:UcSC和EnsemblGenomeBrowser、NCBlGenomeDataViewer等,提供了涵盖多个物种的基因组数据和工具。:本地基因组浏览器包括IGV(IntegrativeGenomicsViewer)、IGB(lntegratedGenomeBrowser)等。10
10 生物信息学 课程 Bioinformatics 基因组学概述 基因组学数据可视化 • 常见的基于网络的集成基因组浏览器包括:UCSC和Ensembl Genome Browser、NCBI Genome Data Viewer等,提供了涵盖多个物种的基因 组数据和工具。 • 本地基因组浏览器包括IGV (Integrative Genomics Viewer)、IGB (Integrated Genome Browser)等