Your Good Partner in Biology Research

Nature:基因组语言的复杂语法

日期:2015-11-11 09:21:12

 瑞典卡罗林斯卡学院的一项新研究证实,人类遗传密码的“语法”远比世界上最精心建立的语言还要复杂。发表在《自然》(Nature)杂志上的研究结果,解释了人类基因组如此难以解译的原因——并有助于进一步了解遗传差异在个体水平上影响疾病形成风险的机制。

 

论文的主要作者、生命科学与营养学系博士生Arttu Jolma说:“基因组中包含了构建和维持生物体所需的所有信息,也储存着有关个体形成如糖尿病、心脏病和癌症等常见疾病的风险的详细信息。如果可以提高我们阅读及理解人类基因组的能力,我们将能够更好地利用很多疾病迅速累积的基因组信息来获得医学利益。”

 

2000年的人类基因组测序揭示出了,构成人类基因组的30亿ACGT碱基是如何排列的。然而,只知道碱基的顺序不足以将基因组发现转化为医学利益;还需要了解碱基序列的意思。换句话说,有必要识别出基因组语言的“单词”和“语法”。

 

我们体内的细胞具有几乎完全相同的基因组,细胞之间彼此不同是因为不同的基因在不同类型的细胞中活化(表达)。每个基因都有一个调控区域,包含了控制基因何时及在何地表达的指令。转录因子结合特异的“DNA单词”来读取这一基因调控密码,上调或是下调了相关基因的表达。

 

Jussi Taipale教授的领导下,卡罗林斯卡学院的研究人员鉴别出了个别转录因子识别的大多数DNA单词。就像在人类自然语言中一样,DNA单词可以结合组成被多个转录因子读取的复合单词。但以往从未探讨过读取这样的复合单词的机制。因此,在他们近期的Nature研究中,Taipale研究小组检测了成对转录因子的结合偏好,系统绘制出了它们结合的复合DNA单词图谱。

 

分析结果解释,遗传密码的语法比最复杂的人类语言还要复杂。并非简单地删除一个空格让两个单词结合到一起,结合组成复合DNA单词的单个单词发生了改变,生成了大量全新的单词。

 

Arttu Jolma 说:“我们的研究发现了许多这样的单词,增进了我们对正常发育和癌症中基因调控机制的认识。这些研究结果为破解控制基因表达的遗传密码铺平了道路。”