Your Good Partner in Biology Research

中国基因组测序成果登Nature子刊

日期:2012-05-15 08:16:55

来自深圳华大基因研究院,张家口市农业科学院,丹麦哥本哈根大学的研究人员发表了题为“Genome sequence of foxtail millet (Setaria italica) provides insights into grass evolution and biofuel potential”的文章,最新完成了一种植物:谷子(foxtail millet,学名Setaria italica)的全基因组测序,谷是目前种植第二广泛的粟类物种,这项研究为提高谷类粮食遗传性状提供了宝贵的资源。相关成果公布在513Nature Biotechnology杂志上,目前这一论文免费开放。

 

文章的通讯作者分别是深圳华大基因的汪建和王俊两位研究员,以及张家口市农业科学院的赵治海研究员。第一作者为华大基因研究院副院长张耕耘研究员等人,张耕耘表示,“这一全基因组序列的解析,是揭示作物遗传调控奥秘的关键步骤,也是生物学研究和育种的一个重要平台。”

 

谷子基因组

 

谷子又称为粟,去壳后称为小米。谷子起源于我国,已有7000年栽培历史,是传统的优势作物、主食作物、抗旱耐瘠作物,在中华悠久的文明史上发挥了重要作用。然而,谷子的主产区多为干旱少雨的贫困地区,产量低一直是困扰谷子生产的最大难题。在一些山区、半山区只能以种谷为生的农民们,祖祖辈辈种着亩产不足70公斤的谷子,苦苦地挣扎在贫困线上。

 

“传统品种的低产量极大的限制了谷子的种植和利用”,张耕耘说,“张家口市农业科学院的赵治海研究员近年来培育出了杂家品种,将谷子的产量提高了一倍。我希望这项研究成果能作为一个范例——应用基因组序列,更好的理解,更快的培育出之前被忽视的农作物,具有更高产量的,质量更好,耐受性更强的新品种。”

 

在这项研究中,研究人员利用新一代测序技术,对一种国内北部谷子品系:张谷(Zhang gu)进行了从头测序(de novo assembly),获得了大小约为423MbN50达到了1.0Mb),包含38,801个蛋白编码基因的全基因组序列,这些基因预测超过81%已经表达。通过基因组注释和分析发现,谷子基因组中的重复序列约占整个基因组的46%

 

除此之外,研究人员还对另一谷子品系A2进行了重测序——A2是一种广泛使用的谷子杂交雌株品系,利用这两个品系亲本F2代群体,完成了高密度遗传连锁图谱。

 

基因组数据分析比对

 

通过将谷子基因组与水稻基因组进行比对,研究人员发现了谷子染色体的进化规律和变化趋势,这对于了解这一农作物的进化具有重要意义。“我们发现九种谷子染色体是在三个染色体重组事件后形成的”,张耕耘说,“这三个事件,其中两个出现在谷子从水稻分化之后,接下来在谷子从高粱分化之后,又出现了一次染色体重排。”

 

相比于C3植物(如水稻和小麦),C4植物具有更高的水分利用效率和光合效率,以及抗旱能力。谷子就是一种二倍体C4植物,利用其基因组序列数据,研究人员能更全面的分析C4光合作用途径的几种关键基因,结果他们发现在C4碳固定途径中出现的基因,也出现在了C3植物中,因此研究人员推测C4途径可能是由于调控表达的差异所引起的功能上的改变导致的。

 

谷子基因组序列的绘制完成,有利于分析作物数量性状位点,在这项研究中,研究人员就利用谷子基因组帮助鉴定了抗除草剂基因,并且精确识别出了抗稀禾定性状相关的基因,印证了之前研究表明的一个单核苷酸突变位点(SNP)可能是导致植株对稀禾定敏感性发生改变的结论。

 

测序方法

 

这项研究采用了全基因组鸟枪法-新一代测序方法,来组装绘制这一基因组图谱。测序采用的是Illumina第二代测序仪(Illumina Genome Analyzer II以及HiSeq 2000,分别负责短插入片段文库和长插入片段文库 ),数据过滤后,研究人员将约40Gb的数据呈递给SOAPdenovo