构成蛋白质分子的氨基酸种类、数目以及排列顺序决定了蛋白质的多样性。而数百万年、数十亿年的自然选择过程形成了蛋白质的自然多样性。目前已知的功能蛋白质仅仅代表了自然界中蛋白质的一小部分。完整地复原功能蛋白质的自然多样性,不仅可以为探究天然蛋白质的进化过程奠定基础,还可以为蛋白质工程改造提供大规模数据库。然而传统的环境宏基因组方法,如压力筛选阳性克隆,或通过设计引物从宏基因组中克隆目标基因,都不能大量获得自然界特定家族未知蛋白。近日,中国科学院遗传发育所农业资源研究中心李小方研究团队,通过创新的基于序列的宏基因组学和功能基因组学技术,从全球不同生境挖掘到了大量新颖铜抗性copA功能基因。该研究以“Sequence-based Functional Metagenomics Reveals Novel Natural Diversity of Functioning CopA in Environmental Microbiomes”为题发表在了国际知名期刊Genomics, Proteomics & Bioinformatics上。
蛋白质自然多样性的概念在进化生物学的研究以及蛋白质工程改造中起着至关重要的作用。例如,研究者广泛利用DNA定向RNA聚合酶β亚基(RpoB)和固氮酶铁蛋白(NifH)的自然多样性来研究微生物的系统发育,特别是那些不可以人工培养的微生物。在这项研究中,李小方研究团队开发了基于序列的功能宏基因组学流程,通过结合宏基因组组装、本地BLAST、进化踪迹分析、化学合成以及传统功能基因组学技术,挖掘了全球微生物宏基因组数据中的铜抗性基因copA的多样性。此研究共收集了来自世界各地的87个宏基因组数据,从数亿蛋白序列中筛查到近100000条候选序列,进一步手工筛查获得175个高置信新颖copA基因序列。系统发育分析表明,几乎所有预测到的CopA蛋白都与已知CopA蛋白有近缘关系,其中55个序列来自完全未知的物种。通过化学合成10个预测copA基因和3个已知copA基因并转化铜敏感大肠杆菌,发现其中5个预测copA基因不仅提高了宿主的铜抗性,同时促进了宿主对铜的吸收。该研究不仅扩展了我们对环境微生物CopA功能多样性的认识,也为基因工程修复生物材料的开发提供了宝贵的基因资源。
中国科学院农业资源研究中心硕士研究生李文君和特别研究助理王丽琨博士为文章的共同一作。李小方研究员为论文通讯作者,中国科学院遗传发育所刘永鑫高工为文章的共同通讯作者。本研究得到了国家自然科学基金面上项目(No. 41877414、U21A20182)和青年科学基金项目(31700228)、河北自然科学基金杰出青年项目(D2018503005)、国家重点研发计划项目(2018YFD0800306)的资助。
论文链接:https://doi.org/10.1016/j.gpb.2022.08.006
生信全流程原始代码:https://github.com/ebg-lab/CopA 或者 https://ngdc.cncb.ac.cn/biocode/tools/BT007306.
获得的新颖铜抗性蛋白序列多属于全新的世系,代表性蛋白表现功能活性并正确定位