生物信息学课程101计划Bioinformatics第二节生物信息学的历史与趋势
生物信息学 课程 Bioinformatics 第二节 生物信息学的历史与趋 势
生物信息学课程生物信息学历史发Bioinformatics-大数据与人工智能时期(2013-)国出学(1976-2001)2013:人天计期层动1976:第个工程公线立:2014:HMPM1(HMP/HMP2)招)1977:每信研究小组高成第一个全品送组库+2015:人类表基固旧计期发布购线性表成器博物生物学时(1859-1952)生物信息学发图体中-X174时率:内售7的发理国用量:精准庆疗的提进1859:活文(物)出19811中宝预电为系信系报通能热人MM·2016:保ESCNGDETOE:电料+1865:20定律工e线1809:西次分周海IDNA人用脑网解国:全间移采妞学技术发展的各个时期:1985:爱利创安PCR技术:生物信票学专业+1879:电至明股家时号批9券+周科(CABOS)创列:净国生物信思学受议1900:五电小通传线的建新发用+2017;中荣十为人器国计销”需格:人点(GCB)N行,1902:务0口用手传,送电律新型组学计点:人美维图港计期自动:面次合1909:消话9004出1986:日车核酸序限的人工成基的生态体1911:禁色伴通在更中刘数据库DDI/家生:蛋白质教据市SWSS.:2018:单电用水手烟服通系海路技光:地界落:1941:年88图-个月PROTBES创单系净热真核热出现:小要基因用国所1943:ONANOEG:1988:美国国家生物技术您量中心(NCBI)成经13年续和宅成:美国发起五百万人基国1期194:DNA区B线:热系01975:DNA测承工作的开会2+2019:国车限国科学都盟中心(NGOC)成发理:屏定用发装(生容地纤么)2012:CRSPR/Ca器用编据系捷用;ENCODE发表性通究能用:·1973:第一个动基报克屋:1990:国际人天国明十(HGP)招1952:ONAO80欢北萌国新加生物信塑中心国店动十万人基国用件:款州销来型用路国解物型联盟成立1993:中国人美E十(CHGP)E线:1972:伯格发现第一个量拍DNADNA显能捷用利城动:新型人造DNA构售HGP新5年计租:欧生物信学研究所(EBI):2010:外盘子测事:三代粥事技术的出现,1968:发现第个用性购·1990:中国人三#国电用代力9心()爱电家电加电:HMP2发的图性班究证单快准成立:第一第IMB国联会家美国国车医学2009美/,高度和用个主米品用的用低字:插富加发单旧图转班:1965:中国人工台成牛锁谢店票中心大生物快学国牌2020:首人关雄是公布;Aiphufold2在(NLM)单行别技术(APBoNt)Q美国Celeai之:1961:mRNA将信B从细能报内传递到细图质在服白送结物预里大害CASP14成速优用:,1994:蓝尔全新德出白低组(Pioteome)的2008:千人基国电期序计期自期:从电#1001样系期序动开童人关品国相范单:生生基因组充成TCGA发承的绿性研究试单1959:英色体异常致病技发膜武务、经国区CABIOSF更多为Bicinfomatics+2007!界首的“个人版基国图卖:人微生物用(HMP)启动2021:成功用Aphafold2详爱个人美白三1958:降童尔森和新塔证实DNA的半保留爱+1995:人美热国用拍线能进光线:B本信感生1999:中北生大英通究中心我堂:中清大用配成立第一个活物表型研究中心(APPF)我的(%8.5%的人送强白费)物字中心(CIB)成立:淘能感血科器制:宽拉更期出中心法则RAAHGP单租工作:人22号2006:中国科学修号人美号动色伴的DNA光成序到注总分折:#性基:2022:OpA开始人工书淘天路人程序色(HaemophisinfiuerzaeRd)全图1956:血红蛋自的一个配基器改安可以导放端因电面通计数(TCGA)动ChatGPT:T2TConsortium人美·2000:年国村下至上海生市科用证免生者发布优彩性货息,2005:大择提扣购摄用发表:HapMa用日充成:二代用米的基国批计6%快ee:国用电品通计创的%:1996:北家大学重白区工程和商物路作学工程:1955:人送的46系快色体的明定,DNA聚台带2004:大品和购益国旺草正克线·202:技自#人工易能丽新的料学质究惠,日单国科学家意老器事用成人洋第21对的限品验人股用动学生招导购销非工库:单线基器汽式的发现,个蛋白质序列牛胰马惠版测定+2003:中国科子中总国组时乐帝(国家生物的急中心)球应:HGP克零膜的看工作:最次亮式对人美Y来色练的壳型[MnTAftymeti生产商mDN芯片2001:自全的能学衣(CCh)厅现:DNA元索西科全(NCODE)计启动:人美装买品国计十超动1953:高拉克、天费、富兰克林和我尔金斯等车:AphafodA能能预用几手所有已国白+19971北联大乐生物热电学中心(C8)成立中国国维工E:黑BB2002:小品基国光成:人美基国用单体(HpM)计然自器西活牌:人工程能在费销发国开发中的用中国科学国B开DNA芯片的驾状与丰第人发现DNA双据结构美,中国科学家和美国Ceie会国台公2024:Aiphafold328全组用学商合设:大开国提国维光成最基图组时期(2002-2012)分子生物学发展时期(1953-1975)有人美基医请的护技单11
11 生物信息学 课程 Bioinformatics 生物信息学历史发 展 生物信息学发 展的各个时期
生物信息学课程101计划生物技术与信息技术的协同发展Bioinformatics生物信息起源期生物信息初创期生物信息成熟期:高通量时代分子进化理论:PaulingL(1962)GenBank释放(1982)二代测序技术(~2005)+:第一个生物序列数据库AtlasofProteinBioinformatics杂志前身被创建(1985)oRoche/454,llumina Solexa,ABISOLiDSequences :DayhoffM(1965)功能基因组计划NCBI成立(1988).。HapMap计划2002)第一个生物信息学软件COMPROTEIN:BLAST算法(1990)8Dayhoff M和 LedleyRS(1958-1962)ENCODE计划(2003)。表观基因组计划(2003)Needleman-Wunsch序列比对算法癌症基因组计划(TCGA,2006)NeedlemanSB和WunschCD(1970)。宏基因组计划(HMP,2007)PAM矩阵:DayhoffM及其同事(1978)。1000基因组计划(2008)2010-至今1970-19801990-2000整合生物学OOOOO系统生物学1950-19701980-19902000-2010生物信息萌芽期生物信息发展期:基因组学兴起生物信息黄金期:大数据时代第一代测序技术Sanger法(链终止法):Sanger中心成立(1993)三代测序技术(2010)SangerF (1977)0EMBL核酸数据库(1993)o PacBio(2010).ONT(2014)Bioinformatics概念首次提出:HogewegP生物大数据科学计划Pubmed数据库(1997)和HesperB(1978)0英国10万人基因组计划(2012)人类基因组计划(HGP)第一款DNA序列分析软件Staden:。精准医疗(2015),人类表型组计划模式物种基因组:酵母(1996)、果蝇BonfieldJ和StadenR(1979)(2017)(1999)、线虫(1998)、救南芥(2000)国家基因组科学数据中心成立(2016)基因组拼接软件AlphaFold(2018),AlphaFold3(2024)分子生物学的发展GeneFormer,scGPT,sfoundation (202
生物信息学 课程 Bioinformatics 1950-1970 1970-1980 1980-1990 1990-2000 生物信息发展期:基因组学兴起 ▪ Sanger 中心成立(1993) ▪ EMBL 核酸数据库(1993) ▪ Pubmed数据库(1997) ▪ 人类基因组计划(HGP) ▪ 模式物种基因组:酵母(1996)、果蝇 (1999)、线虫(1998)、拟南芥(2000) ▪ 基因组拼接软件 生物信息初创期 ▪ GenBank 释放(1982) ▪ Bioinformatics 杂志前身被创建(1985) ▪ NCBI 成立(1988) ▪ BLAST 算法(1990) 生物信息萌芽期 ▪ 第一代测序技术 Sanger 法(链终止法): Sanger F(1977) ▪ Bioinformatics 概念首次提出:Hogeweg P 和 Hesper B(1978) ▪ 第一款DNA序列分析软件 Staden: Bonfield J 和 Staden R(1979) 生物信息起源期 ▪ 分子进化理论:Pauling L(1962) ▪ 第一个生物序列数据库 Atlas of Protein Sequences:Dayhoff M(1965) ▪ 第一个生物信息学软件 COMPROTEIN: Dayhoff M 和 Ledley RS(1958-1962) ▪ Needleman-Wunsch 序列比对算法: Needleman SB 和 Wunsch CD(1970) ▪ PAM矩阵: Dayhoff M及其同事(1978) 2000-2010 生物信息成熟期:高通量时代 ▪ 二代测序技术(~2005) o Roche/454、Illumina Solexa、ABI SOLiD ▪ 功能基因组计划 o HapMap 计划(2002) o ENCODE计划(2003) o 表观基因组计划(2003) o 癌症基因组计划( TCGA,2006) o 宏基因组计划(HMP,2007) o 1000基因组计划(2008) 2010-至今 生物信息黄金期:大数据时代 ▪ 三代测序技术(2010) o PacBio(2010)、ONT(2014) ▪ 生物大数据科学计划 o 英国10万人基因组计划(2012) o 精准医疗(2015)、人类表型组计划 (2017) ▪ 国家基因组科学数据中心成立(2016) ▪ AlphaFold(2018)、AlphaFold3(2024) ▪ GeneFormer、scGPT、scFounda1 tio2 n(202 整合生物学 系统生物学 生物技术与信息技术的协同发展 分子生物学的发展
生物信息学课程101计划生物技术与信息技术的协同发展Bioinformatics生物信息起源期生物信息初创期生物信息成熟期:高通量时代Fortran : BackusJ (1957)R:GentlemanR和thakaR(~1980)Scala :OderskyM (2003)LISP:McCarthyJ(1958)C++:StroustrupB (1983)云计算(CloudComputingBASIC:Gates B等(1964)Objective C:Cox B和 LoveT (1983)-.。亚马通AWS(2006)o Google App Engine (2008)GNU协议:Stallman R(1985)PASCAL :WirthN (1970)8微软Azure(2009)Perl : Wall L (1987)区块链(Blockchain,2008)Python : Rossum G (1989)GO:Google(2009)WWW技术:Berners-LeeT(~1990)RobertGentleman2010-至今1970-19801990-2000整合生物学OOOO系统生物学1950-19701980-19902000-2010生物信息萌芽期生物信息发展期:基因组学兴起生物信息黄金期:大数据时代C : Ritchie D (1972)Linux : Torvalds L (1991)Swift:Apple(2014)深度学习提出(2012)OSQL:Boyce R和ChamberlainD(1972)VisualBasic:用户图形界面GUI(1991)CNN(2012)Smalltallk : Kay A, Goldberg A 和 Ingalls DRuby : Matsumoto Y (1993)。深度强化学习(2014)(1972)Java :Gosling J (1995)oTransformer(2017)JavaScript :Eich B (1995)深度学习主流框架TensorFlow(201s)PHP : LerdorfR (1995)计算机科学的发展LinusoPyTorch(2016)C# : Microsoft (2000)ChatGPT3.0(2020)人工智能时代崛起13
13 生物信息学 课程 Bioinformatics 1950-1970 1970-1980 1980-1990 1990-2000 生物信息发展期:基因组学兴起 ▪ Linux: Torvalds L(1991) ▪ Visual Basic:用户图形界面 GUI(1991) ▪ Ruby:Matsumoto Y(1993) ▪ Java:Gosling J(1995) ▪ JavaScript:Eich B(1995) ▪ PHP:Lerdorf R(1995) ▪ C#:Microsoft(2000) ▪ R:Gentleman R 和 Ihaka R(~1980) ▪ C++:Stroustrup B(1983) ▪ Objective C:Cox B 和 Love T(1983) ▪ GNU 协议:Stallman R(1985) ▪ Perl:Wall L(1987) ▪ Python:Rossum G(1989) ▪ WWW 技术:Berners-Lee T(~1990) 生物信息萌芽期 ▪ C:Ritchie D(1972) ▪ SQL:Boyce R 和 Chamberlain D(1972) ▪ Smalltalk:Kay A, Goldberg A 和 Ingalls D (1972) 生物信息起源期 ▪ Fortran:Backus J(1957) ▪ LISP:McCarthy J(1958) ▪ BASIC:Gates B等(1964) ▪ PASCAL:Wirth N(1970) 2000-2010 生物信息初创期 生物信息成熟期:高通量时代 ▪ Scala:Odersky M(2003) ▪ 云计算(Cloud Computing) o 亚马逊AWS(2006) o Google App Engine(2008) o 微软Azure(2009) ▪ 区块链(Blockchain,2008) ▪ GO:Google(2009) 2010-至今 生物信息黄金期:大数据时代 ▪ Swift:Apple(2014) ▪ 深度学习提出(2012) o CNN(2012) o 深度强化学习(2014) o Transformer(2017) ▪ 深度学习主流框架 o TensorFlow(2015) o PyTorch(2016) ▪ ChatGPT 3.0(2020) ▪ 人工智能时代崛起 整合生物学 系统生物学 生物技术与信息技术的协同发展 计算机科学的发展 Linus RobertGentleman
生物信息学课程生物信息学的历史BioinformaticsFrederickSanger将腻中国团队在世界上第一次人工全岛素的氨基酸序列完整合成了与天然牛胰岛素分子化学地定序出来,同时证明结构相同并具有完整生物活性的L蛋白质具有明确构造。蛋白质·且生物活性达到天然牛胰岛素的80%。?19551965197519531958Sanger发展出一种称为FrancisCrick,James中国科学院上海生物化学研究所提出Watson和Maurice链终止法(chain人工合成胰岛素。同年年底该项目被Wilkins发现DNA双螺列入1959年国家科研计划:并获得terminationmethod)的旋结构。国家机密研究计划代号"601”,意为”技术来测定DNA序列这种方法也称作“双去氧六十年代第一大任务”。终止法"或是“桑格法”。14
14 生物信息学 课程 Bioinformatics 中国团队在世界上第一次人工全 合成了与天然牛胰岛素分子化学 结构相同并具有完整生物活性的 蛋白质,且生物活性达到天然牛 胰岛素的80%。 1958 中国科学院上海生物化学研究所提出 人工合成胰岛素。同年年底该项目被 列入1959年国家科研计划,并获得 国家机密研究计划代号“601”,意为“ 六十年代第一大任务”。 1955 Frederick Sanger将胰 岛素的氨基酸序列完整 地定序出来,同时证明 蛋白质具有明确构造。 1965 1975 Sanger发展出一种称为 链 终 止 法 (chain termination method)的 技术来测定DNA序列, 这种方法也称作“双去氧 终止法”或是“桑格法”。 1953 Francis Crick,James Watson和Maurice Wilkins 发现DNA双螺 旋结构。 生物信息学的历史