2017年度聚焦:DNA测序深度分析

本文系生物谷原创,欢迎分享,转载须授权!
基因组学是一门研究生物基因组的组成,基因组中各基因的精确结构、相互关系及表达调控的科学。在基因组学中,科学家们通过新型的基因测序仪分析生物样本(组织、细胞、血液样本等)的基因组信息,并将这些信息用于临床医学诊断、个体化用药指导、疾病发病机理研究、生命调控机制研究等领域。
图1.染色体、dna和基因
基因测序是一个新兴行业,处于快速发展阶段。全球基因测序行业的市场规模巨大。从1990年人类基因组计划(hgp)正式启动以来,基因测序应用的壮阔前景开始展现在人类面前。2006年第二代测序仪诞生,成本下降百倍,形成“超摩尔定律”之势。随着测序成本的显着降低和生物信息分析能力的显着上升,美国等西方发达国家已在这一领域做出前瞻式布局:鼓励高端测序仪的研发和商业化、建立配套的生物信息计算平台、推进基因组领域的科学研发和临床转化。
第一部分测序技术的发展
不论是基因测序(或者说dna测序)还是基因组测序,都涉及通过测序仪器测定dna的碱基排列顺序,从而解读dna的遗传密码。迄今为止,dna测序技术和用于基因/基因组测序的测序仪器已历经几代的发展,如图2所示。
第一代测序技术,即sanger测序技术:1977年,被后人誉为“基因组学之父”的英国生物化学家弗雷德里克-桑格发明了酶测序法(桑格测序法),正式奠定了测序技术的理论基础,在此9年后,abi公司基于桑格测序法推出了世界上第一台商用测序仪,自此测序技术进入飞速发展的时代;第二代测序技术是当今主流技术,主要有illumina公司的solexa和hiseq技术,life technologies的solid技术和罗氏的454技术;第三代测序技术是近几年研发出的单分子测序技术,主要包括helicos公司的真正单分子测序技术(truesingle-moleculesequencing, tsmstm)、牛津纳米孔技术公司(oxford nanopore technologies,以下称牛津纳米孔公司)的单分子纳米孔测序技术(single-molecule nanopore dna sequencing)、太平洋生物科学公司(pacific biosciences)的单分子实时测序技术(single molecule real-time sequencing, smrt)等。
图2.基因测序发展历史
这三代测序技术各有优缺点(见表1),应用的领域也不尽相同,因此第一代测序技术仍未被淘汰,目前的测序市场是3代测序技术并存的局面。
表1.三代测序技术的优缺点
第二代的基因测序技术目前已经成为市场商用主流。三代测序将是未来的大势所趋,但是预计在将来5-10年内二、三代基因测序会共存,但二代测序仍将是测序市场商业应用主流。三代测序和二代测序相比较,潜在优势明显,但是劣势也限制了三代测序的商业应用。
近年来全球基因测序市场快速增长。从全球的范围来看,目前测序市场规模增长最快的是亚洲市场,其中中国和印度的市场增长率均超过了20%,是全球增长最快的国家。随着东南亚地区生物医药行业持续的快速发展,未来中国基因测序市场的增长仍将引领全球。
第二部分测序仪器
1.国外基因测序仪
目前市场上的测序仪基于使用的测序技术,也主要分为三代,现阶段临床应用较为广泛的还是第二代测序仪,主要生产商主要有life technologies(被thermo fisher收购)、illumina和罗氏。
1.1 illumina公司
illumina作为测序行业的龙头企业,所占市场份额达70%。最初由四位博士于1998年共同创建,总部位于美国加利福尼亚圣地亚哥,主要销售微阵列芯片。2006年收购solexa公司,获得新一代高通量测序技术,从而成为目前市场上的主流测序技术公司。
illumina测序仪可分为桌面式高通量测序仪,其总体特征为快速简约和高效便捷;生产规模测序仪,其总体特征为强大高效和适合生产。illumina桌面式高通量测序仪有miniseq系列——miniseq系统(2016年1月);miseq系列——miseq系统(2011年2月)、miseq dx系统(2013年11月)和miseq fgx系统(2015年1月);nextseq系列——nextseq500(2014年1月)和nextseq550(2015年1月)。illumina生产规模测序仪有hiseq系列——hiseq 2000(2010年1月)、hiseq 2500(2012年1月)、hiseq 3000(2015年1月)和hiseq 4000(2015年1月);hiseqx系列——hiseqxfive(2015年1月)和hiseqxten(2014年1月);novaseq系列——novaseq 5000系统(2017年1月)和novaseq 6000系统(2017年1月)。
此外,illumina测序仪还包括ga系列——genomeanalyzer和genome analyzeriix。genomeanalyzer最初是solexa公司自己推出的下一代测序系统。2006年illumina公司收购了solexa,在不断测序和改良后,推出了genome analyzeriix和hiseq2000平台。
illumina测序采用边合成边测序技术(sequencing by sythesis, sbs)和可逆末端终结技术(reversible terminator chemistry)。illumina公司的genome analyzeriix和hiseq应该说是目前全球使用量最大的第二代测序机器,这两个系列的技术核心原理是相同的。这两个系列的机器采用的都是边合成边测序的方法
1.2罗氏公司
作为集合制药与诊断为一体的瑞士巨头,罗氏集团旗下的诊断部门(罗氏诊断)是体外诊断的全球领导者。罗氏诊断生命科学部是罗氏诊断旗下的核心事业部之一,自收购德国宝灵曼公司后成立,拥有从分子生物学到细胞组学再到蛋白质组学的仪器和科研试剂类产品,包括lightcycler系列实时荧光定量pcr系统,全自动样本制备系统magna lyser和magna pure,高效的细胞计数仪cedex hires,发酵参数检测生物过程分析仪cedex bio/ht,还有nimblegen测序上游富集方案以及454和未来的三代、四代测序仪。
1.2.1罗氏测序系统
454公司可谓新一代测序技术的奠基人。2005年底,454公司推出了革命性的基于焦磷酸测序法的超高通量基因组测序系统——genome sequencer 20 system,开创了边合成边测序的先河。之后,454公司被罗氏诊断公司以1.55亿美元收购。2007年,他们又推出了性能更优的第二代基因组测序系统——genome sequencer flx system(gs flx)。2008年10月,全新的gs flx titanium系列试剂和软件的补充,让gs flx的通量一下子提高了5倍,准确性、读长也进一步提升。
2015年,罗氏诊断推出了7款诊断测试产品和8款仪器,包括分子诊断产品cobas 6800和cobas 8800系统和组织诊断产品ventana he 600系统;收购了4家公司,依次是ariosa diagnostics、signature diagnostics、capp medical和kapabiosystems,为集团打造了下一代测序平台的一站式服务。
2013年9月,罗氏与太平洋生物科学公司(pacbio)签订协议,以pacbio的smrt技术为基础开发诊断产品,包括前期、里程碑和供应付款在内,罗氏向pacbio支付7500万美元。根据这项协议,pacbio将开发并制造供临床使用的测序系统和消耗品。
2014年上半年,罗氏先后收购分子诊断公司iquum和正在开发纳米测序平台的genia technologies公司;下半年,罗氏又从abvitro公司收购了用于ngs样品制备的靶向富集技术;到了12月初,罗氏宣布收购ariosa diagnostics公司,扩充其体外诊断业务,进军无创产前检测(nipt)行业;12月下旬,罗氏又宣布收购基因组分析公司bina technologies,进一步为其基因组学范畴的业务蓄势。
罗氏诊断的测序战略三管齐下。首先,获得颠覆性的测序技术,如对四代纳米孔测序公司genia的收购;其次,在开发新平台的同时,维持其在测序市场的地位,罗氏诊断承诺将持续提供454测序试剂、耗材和维修服务,同时不断在nimblegen seqcap产品上推陈出新,推出富集差异化的新一代测序上游靶向富集方案;再次,提供一套集成的解决方案,跨越(包含)多项用于全面诊断的技术。
1.2.2罗氏454测序原理:
roche 454测序系统是第一个商业化运营二代测序技术的平台。它的主要测序原理如下所示:
(1)dna文库制备
454测序系统的文件构建方式和illumina的不同,它是利用喷雾法将待测dna打断成300-800bp长的小片段,并在片段两端加上不同的接头,或将待测dna变性后用杂交引物进行pcr扩增,连接载体,构建单链dna文库(见图3)。
图3. dna文库制备
(2)emulsion pcr (乳液pcr,其实是一个注水到油的独特过程)
454测序仪的 dna扩增过程也和illumina的截然不同,它将这些单链dna结合在水油包被的直径约28um的磁珠上,并在其上面孵育、退火。
乳液pcr最大的特点是可以形成数目庞大的独立反应空间以进行dna扩增。其关键技术是“注水到油”(水包油),基本过程是在pcr反应前,将包含pcr所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的pcr反应空间。详细步骤如图4所示。理想状态下,每个小水滴只含一个dna模板和一个磁珠。
图4.乳液pcr
这些被小水滴包被的磁珠表面含有与接头互补的dna序列,因此这些单链dna序列能够特异地结合在磁珠上。同时孵育体系中含有pcr反应试剂,所以保证了每个与磁珠结合的小片段都能独立进行pcr扩增,并且扩增产物仍可以结合到磁珠上。当反应完成后,可以破坏孵育体系并将带有dna的磁珠富集下来。进过扩增,每个小片段都将被扩增约100万倍,从而达到下一步测序所要求的dna量。
(3)焦磷酸测序
测序前需要先用一种聚合酶和单链结合蛋白处理带有dna的磁珠,接着将磁珠放在一种ptp平板上。这种平板上特制有许多直径约为44um的小孔,每个小孔仅能容纳一个磁珠,通过这种方法来固定每个磁珠的位置,以便检测接下来的测序反应过程,如图5所示。
图5焦磷酸测序
测序方法采用焦磷酸测序法,将一种比ptp板上小孔直径更小的磁珠放入小孔中,启动测序反应。测序反应以磁珠上大量扩增出的单链dna为模板,每次反应加入一种dntp进行合成反应。如果dntp能与待测序列配对,则会在合成后释放焦磷酸基团。释放的焦磷酸基团会与反应体系中的atp硫酸化学酶反应生成atp。生成的atp和荧光素酶共同氧化使测序反应中的荧光素分子并发出荧光,同时由ptp板另一侧的ccd照相机记录,最后通过计算机进行光信号处理而获得最终的测序结果。由于每一种dntp在反应中产生的荧光颜色不同,因此可以根据荧光的颜色来判断被测分子的序列。反应结束后,游离的dntp会在双磷酸酶的作用下降解atp,从而导致荧光淬灭,以便使测序反应进入下一个循环。由于454测序技术中,每个测序反应都在ptp板上独立的小孔中进行,因而能大大降低相互间的干扰和测序偏差。
454技术最大的优势在于其能获得较长的测序读长,当前454技术的平均读长可达400bp,并且454技术和illumina的solexa和hiseq技术不同,它最主要的一个缺点是无法准确测量同聚物的长度,如当序列中存在类似于polya的情况时,测序反应会一次加入多个t,而所加入的t的个数只能通过荧光强度推测获得,这就有可能导致结果不准确。也正是由于这一原因,454技术会在测序过程中引入插入和缺失的测序错误。
1.3 abi公司/life technologies
2008年,life technologies由美国invitrogen公司和应用生物系统公司(applied biosystems,简称abi)合并而成,随后在2013年4月,该公司又被赛默飞世尔科技公司(thermo fisher scientific,简称赛默飞世尔)收购。
说起全自动测序仪,abi公司那是绝对的领头羊,其3730旗舰测序仪在人类基因组计划中立下赫赫战功。然而,在新一代测序方面,454和solexa抢了先机,率先推出了ngs仪器。abi当然不会作壁上观,让客户的实验室里摆满对手的仪器。于是,它在2006年斥资1.2亿美元收购了遗传分析公司agencourt personal genomics(apg),为的是第二年将新一代测序系统推向市场。apg的核心技术是solid(supported oligo ligation detetion),其独特之处在于以四色荧光标记寡核苷酸的连续连接合成为基础,取代了传统的聚合酶连接反应,可对单拷贝dna片段进行大规模扩增和高通量并行测序。
至此,454、illumina和abi在新一代测序领域形成了三足鼎立的局面。正是这种你追我赶,让人类基因组图谱的绘制成本大大降低,时间也大大缩短。不过,illumina率先进入大型的基因组中心,抢占了先机。此后它又推出了高通量的hiseq系列,在通量上领先于solid。因此,abi(及后来的life technologies)始终无力追赶。好在,life technologies高瞻远瞩,放眼快速经济的测序市场,在2010年收购了ion torrent公司。尽管这种半导体测序仪未必适合30亿个碱基的人类基因组测序,但却是更多小型实验室的理想选择。
abi的测序仪器可分为基于solid的测序仪:abi solid 4、abi solid 5500、abi solid 5500xl、3100系列、3130序列、3500序列;基于ion torrent的ion pgm、ion s5和ion s5 xl下一代测序系统。
2.国内基因测序仪
当前的国产测序仪,无论是二代还是三代,其核心零部件都需要进口,比如光学系统中的部分核心器件来自日本、德国,测序芯片和微流控系统需来自新加坡、美国。如此看来,如果未来可以将核心零部件也进行自主研发,其成本还会进一步降低。
目前国产测序仪的测序产品以二代测序仪为主。据cfda官方网站显示,截至今年9月初,我国已经批准的国产基因测序仪共有八款,分别是华大基因的bgiseq-100(基于life technologies的ion proton测序平台)和bgiseq-1000(基于complete genomics公司的测序平台)、bgiseq-500、达安基因的da8600(基于life technologies的ion proton测序平台)、华因康的hyk-pstar-iia、博奥生�...