Your Good Partner in Biology Research

Nature子刊新工具:蛋白与lncRNAs相互作用定量预测

日期:2017-03-02 08:54:28

 为了更全面的了解人类基因功能,而不仅仅只是从已测序的基因组中简单的读取信息,研究员们希望能掌握这些精细的调控原件的各个元素的来龙去脉。许多实验室、联营机构以及项目组都致力于在整体上获得基因组各区域功能以及究竟是在何种细胞内是激活状态的。

 

众所周知,蛋白质是组成细胞的基石。然而,有趣的是,只有一小部分的人类基因组(大约2%)含有蛋白质编码基因。其余98%的基因主要负责调控,即参与控制基因们何时何地表达和激活。这部分庞大的基因组产出RNA分子,其大小、结构以及功能都有所不同,它们被称作非编码RNA。不同类型的非编码RNA与蛋白质相互作用的方式也不相同,因此,很多机构投入了大量的人力物力在此项研究中。至今,仍没有合适的计算方法来处理极长的RNA序列(长链非编码RNA),并且仅通过实验手段来研究它们的结构和功能在如今也是一项巨大的挑战。

 

近期发表在Nature Methods 上的文章介绍了一种新型的计算方法,预测蛋白质和长链非编码RNA之间的相互作用,并且通过了先进实验技术的确认和验证。该篇文章由西班牙的Centre for Genomic Regulation in BarcelonaCRG) ,意大利的EMBLs site in Monterotondo 以及美国California Institute of Technology 共同合作完成。

 

长链非编码RNA作用于多种蛋白质,介导重要的细胞功能。CRGICREA研究所教授,同时也是该篇文章的主要研究员之一的Gian Gaetano Tartaglia解释:“为了了解它们在正常细胞和患病细胞内的功能,通过鉴定它们与蛋白质相互作用的方式将是一个很好的起点。”

 

这项新型的计算方法被称作Global Score(整体打分),它能够帮助科学家预测非编码RNA与蛋白质的物理结合位点。该算法将从全局上评估蛋白质与特定RNA结合的潜在可能性,并且预测该结合位点的局部特征。另外本文的第一作者,CRG的博士后Davide Cirillo补充道:“RNA的结构对预测蛋白质相互作用十分重要。在寻找蛋白质伴侣的过程中,我们过去曾面临的主要挑战是有些RNA序列的长度是否能够被直观地看清其结构特性。

 

Davide 总结道:“这种算法集成了这些信息以后,使我们不仅能够预测蛋白质伴侣,还能够划分优先级对它们进行实验验证。”

 

这项工作再次强调了在先进科学研究领域,生物信息学和计算生物学的相关贡献以及这些学科对生命科学的促进和推进作用。