提高基因组作图准确性的新方法
日期:2015-12-31 08:58:45
如果你已经有了一种生物的基因组序列图,但想要在一个样本中寻找结构异常,你可以检查基因组条形码(barcode)——已知的靶向位点之间的一系列距离,通过切割这些位点上的DNA序列,并检测切口之间的距离。然而,如果通过新一代测序(涉及PCR)得到的原始图,包含任何放大的偏差,研究当中的系统性错误还有改进的余地。为了解决这个问题,美国明尼苏达大学和BioNano Genomics的研究人员,采用动态的时间序列数据,来测量概率分布或者有多少遗传物质分开两个标签——根据链是否被拉伸或压缩,来改进一种纳米通道为基础的基因组作图。
这项研究的通讯作者、明尼苏达大学科学与工程学院的Kevin Dorfman教授称:“想象一下,在DNA骨架上的两个标签,通过一段弹簧连接在一起,这段弹簧模拟它们之间的DNA的构型熵。如果这是一种谐波弹簧…那么,我们希望看到关于弹簧长度其余部分的正反置换的均等机率。”
但是,除了这个正常的曲线,Dorfman和他的同事们观察到了比标签之间延伸更大的压缩,并发现,标签之间的大多数热波动是短暂的事件,这些信息可能有助于提高基因组作图的精度。
Dorfman说:“这种改善对于复杂的样品(如肿瘤)尤其重要,这种样品内的细胞是异质的,所以我们需要很高的精确度,找到罕见的事件。”
过去三年里,在国家卫生部和国家科学基金会资助机构的资助支持下,Dorfman和他的实验室一直与BioNano Genomics的同事合作。他和他的同事们在本周《Biomicrofluidics》杂志详细描述了这项研究工作。
用传统的脉冲场凝胶电泳方法——通过用限制性内切酶切割DNA序列来构建基因组图谱,研究人员所面临的一个问题是,基因组图谱的重新组装,因为常规方法根据各种片段的大小对它们进行分类。然而,在纳米通道方法中,荧光标记有序地停留在在每条链上。这让研究人员能够根据它们的荧光条形码确定整条链的内容,而无需重新组装它们——不用依赖先前获得的作图。
研究人员首先标记DNA,这包括从大肠杆菌细胞中提取基因组DNA,在不同的靶位点上除去一个单一的核苷酸和骨干,并在它们的部位插入荧光核苷酸。每一条DNA链,通常约为300000个碱基对,然后注入45纳米宽的通道。因为DNA的弯曲长度,迫使分子拉伸,它仍然以一种棒状的、可量化的方式移动,大约50纳米。
然后,他们使用数码相机拍摄了标签的位置。而对纳米通道中的DNA进行的典型单分子研究,报告了几十个分子的统计,研究人员的方法涉及到成千上万各分子,每个分子都覆盖一系列标签——从而产生了数以百万计的标签之间的距离测量,这对于确定概率分布是必不可少的。
Dorfman及其同事们今后的工作包括,将这些分布输入到基因组作图算法中。这可以用来将点值图的一段特定序列,分配到基因组的一个特定区域,也有助于理解基因组图上拉伸DNA的结头、褶皱和环结的影响。
上一篇: 《自然》展望2016年11大领域
下一篇: 单分子测序的精确甲基化组分析