20年磨一剑:纳米技术完全测序人类x染色体-凯发k8一触即发

  20年磨一剑:纳米技术完全测序人类x染色体-凯发k8一触即发

20年磨一剑:纳米技术完全测序人类x染色体

2020/07/25
导读
真正完成人类基因组测序的时代已经触手可及

图源:pixabay

 

撰文|陈抒宁

责编|何义均

 
●        ●        

人类基因组计划启动于1990年,如今已匆匆过去30年光景。从2000年人类基因组草图宣告完成后的二十年间,人类参考基因组不断更新迭代。即便如此,其中依然存在数以百计的空缺,尚无一条染色体被真正完成 [1]
 
如今,科学家首次完成了一条 “从头到尾” 真正完整的人类染色体测序。7月14日,《自然》杂志上刊载了美国加利福尼亚大学圣克鲁兹分校的 karen miga 教授团队的研究成果 [2]。该团队使用最新的纳米孔测序技术,首次完成了从端粒到端粒、完整无缺的人类x染色体序列。这或许意味着,真正完成人类基因组测序的时代已经触手可及。
 

1


霰弹枪、拼图与地图上的空缺

 
过去,人类基因组计划使用的测序方法只能用来测定较短的dna序列,长度在100到1000个碱基对间。因此,较长的序列被剪切成末端重复的碎片,并依靠这些重复的部分将碎片重新组装成完整的序列。这种测序方法也被形象地称为 “霰弹枪测序法”。
 
这种方法重建基因组的最大挑战在于如何区分重复的序列 [3]。人类基因中有大量重复的序列,这使得测定出来的许多短链几乎一模一样,既难以拼接,也难以判断到底存在多少个重复区段。就像拼图中我们往往把天空或湖水的部分留到最后,因为在大片的同色色块里,我们便难以确认具体某块拼图的位置一样。
 
现在参考基因组中的空缺包括核糖体dna序列,着丝粒(在细胞分裂时连接两条染色体单体的部位,它们将染色体分为长臂和短臂)中高度重复的dna序列,此外,还有一些富含重复片段的区域,这些重复片段动辄有超过数十万碱基对,重复率超过98% [2]。“目前基因组图谱上缺失的部分,也恰是在人群中序列变异最多的部分,也因此为基因生物学和人类疾病的研究提供了未经探索的序列。完整的基因组图谱有潜力加深我们对遗传疾病的了解。而我们选择x染色体的研究正是因为它和无数的疾病有关,其中包括血友病,慢性肉芽肿性疾病和杜氏肌营养不良。” miga 教授告诉《知识分子》。

 


2


基因的 “安检仪”


要应对黑暗区域的挑战有两种途径:要么测的序列长到可以覆盖一整个重复部分;要么测序足够精确,可以通过区分独特的变量来区分重复的序列 [4]。最新的纳米孔测序技术为超长测序提供了可能。

图1:dna通过纳米孔,随着g、a、t、c碱基以不同的序列通过,电流也产生不同的变化(来源:参考文献5)

 
在实验中,研究人员让dna链通过一个嵌在电阻膜上的纳米孔,就像行李通过x光安检仪一样,“扫描” 出dna上的碱基序列。在测序时,电阻膜被浸入电解质溶液中,并让离子电流通过纳米孔,当dna链上不同的碱基通过纳米孔时,会对这个电流产生干扰。通过解码这些电流信号,研究人员就可以测得特定的dna或rna片段。
 
纳米孔技术不仅可以实时分析长dna片段,而且理论上不再有dna的长度限制。miga 教授告诉《知识分子》,“如果你能让一条百万碱基对长的dna通过纳米孔,它就能识别整条序列。使用了这种超长测序技术后,我们可以获得一个非常非常长链的(超过十万碱基对)、高覆盖率的数据库,从而帮助我们跨越和准确拼装富含重复序列的安检仪。”
 

3


新的里程碑

 
miga 教授和她的团队完成的x染色体序列完整无缺,且估算有至少99.99%的准确率,这意味着平均每1万碱基对才有一个错误。在对x染色体的研究中,miga教授和她的团队重建了约2.8兆碱基对的着丝粒中的dna序列,并且填补了x染色体所剩的29个空缺部分,包括拟常染色体区域和ct抗原基因家族中的新序列,ct抗原基因家族是一种肿瘤特异性抗原,有望用作癌症的免疫治疗 [2]

 
加利福尼亚大学圣克鲁兹分校的助理研究科学家 jain miten 告诉《知识分子》,“端粒到端粒的完整染色体测序是基因组学里程碑式的时刻,而超长测序的技术和算法的发展是使之得以实现的主要因素之一。了解这些曾是未知的‘黑暗区域’的序列结构和表观基因序列图谱,会为生物学带来新的视角。同时,这也是一个分阶段的,端粒到端粒的,完整基因组时代到来的界标。”
 
接下来,miga 教授和她的团队将继续致力于从人类基因组剩余的 “处女地” 上捕捉新的序列和表观基因的变异。miga 教授表示:“我们目前已经有了巨大的进展,并且希望可以在不远的未来和公众分享。我们发现有一些特定的染色体比其他的更容易组装(比如8号和6号)。最难的染色体是带着几乎相同的核糖体dna序列的近端着丝粒染色体如13、14、15、21和22号。同时我们也需要开发新的技术来面对1号、9号和16号染色体上大型人类卫星dna序列的挑战。” 

 参考资料

[1] jain, miten, s koren, j quick, ac rand, ta sasani, jr tyson, ad beggs, et al. “nanopore sequencing and assembly of a human genome with ultra-long reads.” nature biotechnology, 2017. https://doi.org/10.1101/128835.

[2] miga, karen h., sergey koren, arang rhie, mitchell r. vollger, ariel gershman, andrey bzikadze, shelise brooks, et al. “telomere-to-telomere assembly of a complete human x chromosome.” nature, july 14, 2020. https://doi.org/10.1038/s41586-020-2547-7.

[3] staden, r. “a strategy of dna sequencing employing computer programs.” nucleic acids research 6, no. 7 (june 11, 1979): 2601–10. https://doi.org/10.1093/nar/6.7.2601.

[4] nagarajan, niranjan, and mihai pop. “sequence assembly demystified.” nature reviews genetics 14, no. 3 (2013): 157–67. https://doi.org/10.1038/nrg3367.

[5] deamer, david, mark akeson, and daniel branton. “three decades of nanopore sequencing.” nature biotechnology 34, no. 5 (may 6, 2016): 518–24.



 制版编辑 | 皮皮鱼

参与讨论
0 条评论
评论
暂无评论内容
知识分子是由饶毅、鲁白、谢宇三位学者创办的移动新媒体平台,致力于关注科学、人文、思想。
订阅newsletter

我们会定期将电子期刊发送到您的邮箱

go
网站地图