Your Good Partner in Biology Research

基因组测序可靠吗?

日期:2012-02-07 08:33:19

2003年科学家们对外公布完成了人类基因组的测序之后,就一直处于一种自我陶醉之中。然而一个根本性的问题却遭到了忽视:我们如何能确定个体基因组的读取是否正确?

 

十年前,人类首次全面开展了个体基因组的测序,在这项研究中揭示出了全球70亿人的大量遗传变异。然而至此后,对于个体精确测序的质疑就一直困扰着研究者们。

 

测序公司预测他们有能力将基因组测序成本从几年前的2.5万美金降至1000美金,并致力开发出“个体化”医疗,这在当前市场上正日渐显示出重要的意义。测序成本的降低依赖于更新的技术,设想科学家们能够继续使用标准鸟枪法(shotgun approach),将基因组随机处理成大小不同的片段,然后再将这些片段连接起来。尤其是,通过将 DNA处理成更小的片段,有利于快速廉价地读取大量片段,从而达到降低成本的目的。然而其中一个问题是现在人们并不是很清楚如何评估最新装配算法和基本鸟枪法的准确性,尤其是早期的基因组数据的准确性还不确定。

 

确定个体基因组测序准确性的特殊挑战在于使人体的表型(或性状)与他/她的基因型(或遗传结构)相匹配。在首次完成人类基因组测序后不久曾有人预测将很快开发出个体化的医疗,然而由于此障碍的存在,直到现在这一目标也尚未实现。

 

在近期《PLOS One》杂志的一篇文章中,来自纽约大学库朗研究所的研究人员对当前采用的一些个体基因组测序方法进行了评估。

 

纽约大学的研究人员根据一些基因学家和生物信息学家开发的一种称为AMOS的开源软件搜集的特征,检测了这些程序的可行性。研究人员假设,如果一种方法能够实现对个体全基因组的准确测序,那么该方法创建的组件就应该能够“组合到一起”,并与其他的辅助数据,例如"mate pairs," "optical maps," 或“strobed sequences”相一致,共同组成基因组的广泛信息。

 

文章的资深作者、计算机科学与数学系教授Bud Mishra说:“利用当前的大部分技术,在组装基因组的过程中,当遇到基因组中多个位点重复出现相同的序列串,就会产生几种类型的错误。随机输入读值倾向于在此类位置采集,在它们之间显示出了更高的差异性。”

 

“这些错误有可能产生严重的后果,尤其是技术被应用到分析肿瘤基因组时,其往往具有高度异质性,每个肿瘤细胞基因组中均存在于其他细胞不同的重排和突变,”Mishra说。