2021年4月28日,深圳华大生命科学研究院生物多样性基因组研究团队在国际顶级学术期刊《自然》(Nature)上在线发表了题目为“ Evolutionary and biomedical insights from a marmoset diploid genome assembly ”的研究论文。
本研究利用家系基因组测序数据,独立组装出人类疾病研究模型之一——普通狨猴(Callithrix jacchus)的父母本两套高质量的基因组。同时,父母本基因组序列的比较也刷新了人们对于父母本之间遗传信息差异的认识,并通过生长发育相关基因的分析,展示了狨猴作为医学模式物种的遗传学基础。
国家基因库为该项目的数据分析提供了计算资源支撑,同时,项目的部分测序工作依托国家基因库的数字化平台完成。项目所产出的普通狨猴父母本基因组组装数据已存储于国家基因库生命大数据平台(CNGBdb),数据编号:CNA0018880。
研究背景
本次研究涉及到的普通狨猴是原产地在南美的小型灵长类哺乳动物,成年的个体只有手掌大小,是医学研究常用的模式动物。狨猴与人类在解剖学、生理学和药物代谢方面具有许多共同特征,因此能开发出多种医学研究模型。这些模型可以应用到神经退行性疾病、生殖生物学、药物动力学及药物的毒性筛查、干细胞研究、自身免疫性疾病、感染性疾病等多方向的研究中。因此,对狨猴高质量遗传信息的解读,对于推进人类疾病研究非常重要。
狨猴
研究内容
物种的基因组是其遗传学研究最基础的数据。为了得到更完美的狨猴基因组,还原遗传信息的父母本来源,研究团队采用了基于家系的基因组测序和组装方案,利用父母本各自特有的序列,拆分子代数据并各自进行组装和拼接,最终得到了两套各自组装到染色体级别的父母本基因组。两者的单碱基精确度均超过 99.99%,为非人灵长类基因组的遗传和进化研究又提供了一个高质量的数据集。
子代个体的两套染色体一套来自于母亲,一套来自于父亲。传统组装策略获得的是遗传信息混合的基因组,新策略则可以通过父母本特异的序列得到遗传自父母本的两套完整的基因组数据(杨琛涛和周旸 绘)
得益于新的高质量染色体数据,研究团队可以对来自父亲和来自母亲的两套染色体进行直接地比较。本论文第一作者,深圳华大生命科学研究院和哥本哈根大学联合培养的博士生杨琛涛表示,“如果考虑到所有类型的遗传变异,目前一般得出的杂合率结果被远远低估了。另外,有意思的是,来自父亲的种系突变是来自母亲的两倍。这可能与卵细胞和精子的形成过程中细胞发生复制分裂的次数不同有关。”
与人类相比,狨猴的Y染色体上比人多出了一段雄性特异性序列,而一些参与人类精子形成的基因却在狨猴中丢失或者失去功能,这可能与狨猴的婚配方式相关。
研究也发现在狨猴里,一些与卵细胞发育、卵巢功能相关的基因发生了有利于自然选择的变异,可能使狨猴更容易产生双胞胎。此外,研究人员还发现一些同狨猴身体大小、繁殖特征、饮食习惯相关的基因产生了适应性的突变。这些发现扩展了之前的一些研究结果,增加了对狨猴物种本身的了解。
研究意义
通过对狨猴这个生物医学模式物种的基因组测序和组装,研究团队展示了新型测序组装技术极大的应用潜力。这一技术将有助于更精确检测每个人独立的遗传特征,为个体精准医学的实施提供更详细和准确的遗传信息。
“2021年是人类参考基因组草图序列公布20周年。但如何构建参考基因组序列仍是当前基因组研究的重点攻关领域。基因组中包含大量与健康、疾病和表型相关序列,对这些序列的研究有赖于基因组序列的准确度。近几年,完美参考基因组序列的定义一直随着测序技术发展而更新。在此,我们对二倍体物种完美基因组序列提出了新的标准,即二倍体细胞中的两套基因组应分别独立组装到染色体水平并含有极少的测序漏洞。本次研究我们论证了实现这一目标的可行性。”该研究的通讯作者,深圳华大生命科学研究院、中国科学院昆明动物研究所及丹麦哥本哈根大学的张国捷教授总结说。
参考文献
Yang, C., Zhou, Y., Marcus, S. et al. Evolutionary and biomedical insights from a marmoset diploid genome assembly. Nature (2021).
信息来源:“BGI华大”公众号
图片源于Nature官网、“BGI华大”公众号和参考文献,如有侵权请联系删除。