Nucleic. Acids. Res. | HMDD4.0 人类miRNA与疾病关联的数据

2023-10-31 19:30:03 浏览数 (1)

编译 | 曾全晨 审稿 | 王建民

今天为大家介绍的是来自Qinghua Cui团队的一篇数据集论文。微小RNA(miRNA)是一类重要的小型非编码RNA,在几乎所有生物过程中具有关键的分子功能,因此在疾病诊断和治疗中发挥着重要作用。人类微小RNA疾病数据库(HMDD)是与miRNA相关的医学领域的生物医学研究人员的重要综合资源。在这里,作者介绍了HMDD v4.0,该版本从文献中整理了53530个miRNA与疾病相关的条目。与五年前发布的HMDD v3.0相比,HMDD v4.0包含了1.5倍多的条目。此外,还整理了一些新的分类,包括与疾病相关的外泌体miRNA、涉及人类疾病的病毒编码miRNA,以及包含miRNA-circRNA相互作用。作者还整理了与疾病相关的性别差异miRNA。

微小RNA(miRNA)是一类重要的小型RNA分子,它们在基因表达的后转录上主要起到负调控作用。因此,miRNA与许多人类疾病的异常功能关联紧密,同时miRNA也被看作是潜在的疾病诊断、预后以及治疗的有希望的生物标志物,并且在癌症等领域中被认为是有潜力的治疗靶点。因此,建立一个全面的miRNA与疾病相关的数据库对于研究人员来说非常重要,可以用于深入探究miRNA在疾病中的机制,并为疾病的诊断、预防和治疗开发miRNA相关的方法提供有力支持。为了实现这一目标,作者在2007年建立了人类miRNA疾病数据库(HMDD)的初始版本,随后于2013年发布了HMDD v2.0,2018年发布了HMDD v3.0。在过去的15年中,已经对HMDD进行了大约35次的更新,使其成为该领域最全面和具有影响力的数据库之一。

图 1

表 1

通过对miRNA与疾病关系的深入研究,不仅发现了大量新的miRNA与疾病的关联,还发现了多种不同类别的miRNA与疾病的关联。miRBase中记录了320个病毒编码的miRNA,其中一些miRNA参与了人类健康和疾病中的多个关键过程。最近,有报道称SARS-CoV-2病毒衍生的miRNA可能作为COVID-19的诊断生物标志物。因此,有必要建立生物信息学资源来处理病毒编码的miRNA。为此,作者整理了病毒编码的miRNA与人类疾病的关联数据。

鉴于近年来不断积累的新的关于miRNA与疾病关联的数据以及miRNA与疾病关联的不同类别,迫切需要更新数据库,以实现更全面的数据覆盖和更准确的分类。因此,作者使用图1A中显示的流程构建了HMDD v4.0版本。HMDD v4.0包含了53530个经实验证实的miRNA与疾病关联条目,涵盖了1817个人类miRNA基因、79个病毒衍生的miRNA以及来自37090篇论文的2360个人类疾病。与HMDD v3.0相比,HMDD v4.0的数据量增加了1.5倍以上。这些条目根据实验证据被分类为8个不同的类别,包括23种不同的证据标签(表1)。此外,作者还将来自不同疾病的性别偏差miRNA纳入HMDD v4.0,以促进对疾病中性别二态性的理解。

数据总览

表 2

与HMDD的先前版本类似,HMDD v4.0也旨在通过网络提供便捷和全面的数据资源,用户可以通过该资源搜索、浏览、下载和分析实验支持的miRNA与疾病关联数据集。为了整理数据集,作者最初使用关键词如“microRNA”、“miRNA”或“miR”来从PubMed检索所有与miRNA相关的论文。然后,截止到2023年4月获取了69060篇论文以及相应的标题和摘要信息。作者使用BERN2(基于多任务学习和语言模型开发的生物医学实体识别工具)从摘要中提取miRNA和疾病信息,成功地从51215篇论文中提取了miRNA和疾病实体。接下来手动整理了给定miRNA与疾病配对的信息,包括miRNA名称、疾病名称、PubMed ID(PMID)以及关联的实验证据。病毒编码miRNA与人类疾病之间的关联首先在PubMed中进行了筛选,使用每个病毒编码的miRNA,然后进行手动整理。结果,HMDD v4.0整理了173个病毒编码的miRNA与人类疾病的关联,包括79个病毒编码的miRNA和45种人类疾病。然后,作者根据相关证据将miRNA与疾病的关联划分为不同的类别。表1显示了由23个实验证据表示的8个类别的条目数量,其中“病毒”和“外泌体”是两个新整理的类别。此外,还包括了与疾病相关的circRNA与miRNA的相互作用。每个miRNA的名称都是基于miRBase标准化的。图1B显示了miRNA与疾病关联数量以及相关论文的分布情况。在过去五年里,研究miRNA与疾病关联的研究显著增加。因此,HMDD 4.0中的更新关联条目和相应论文分别占总数据的40%以上和50%以上。基于最新的miRNA与疾病关联数据,作者观察到在miRNA与疾病关联研究中最受关注的疾病仍然是癌症,如肝细胞癌、结直肠肿瘤、乳腺癌、非小细胞肺癌和胃癌,如图1C所示。此外,糖尿病及其并发症、阿尔茨海默病和各种心血管疾病也受到了相当多的关注。广泛涉及人类疾病的前5个miRNA是mir-21、mir-155、mir-146a、mir-34a和mir-145(图1D),与HMDD v3.0中报告的结果完全相同,表明研究人员持续关注这些明星分子。HMDD v4.0的改进部分通过与其他类似的miRNA相关疾病/表型数据库进行比较总结在表2中。这些改进包括更多的miRNA与疾病关联、详细的关联类别和方便的功能模块。

数据实用性示例

表 3

图 2

最近,人们普遍认为男性和女性在生理和疾病方面存在巨大差异。事实上,众所周知,许多miRNA在正常人体组织和体液中表现出性别差异化的表达。然而,与疾病相关的性别差异化miRNA大部分仍然未知。因此,作者整理了一些与疾病相关的性别偏差miRNA,包括传染病、肿瘤、内分泌疾病、精神障碍等等,如上所述。此外,作者还进行了基于与发育异常相关的性别偏差miRNA的案例研究(使用了TAM 2.0工具)。整理了与发育异常相关的55个男性偏差miRNA和50个女性偏差miRNA(表3)。使用TAM 2.0的疾病相似性计算模块,作者确定了与发育异常相关的性别偏差miRNA特征最相似或相反的前10种疾病(图2)。结果发现了一些表现出潜在性别偏差的疾病,其中三阴性乳腺癌、宫颈癌等等已被确认具有显著的性别偏差。对于其他疾病,作者也发现了性别偏差的证据,包括肝炎、中风、糖尿病血管病等等。这些结果表明,对这些与疾病相关的性别偏差miRNA进行生物信息学分析可以帮助预测存在性别偏差的疾病。

结论

miRNA在理解多种人类疾病的形成和发展机制方面的重要性不断增加,在疾病诊断和治疗方面显示出巨大潜力。因此,有必要不断更新HMDD,这是该领域最全面的数据库之一。与HMDD v3.0相比,HMDD v4.0实现了显著的进展,不仅数据量增加,还增加了新的数据类别。这是HMDD首次包含病毒编码miRNA并整理其与人类疾病相关的数据。最后,通过案例研究,作者展示了与疾病相关的性别偏差miRNA的生物信息学分析可以为探索医学中的性别偏差提供有价值的信息。作者相信HMDD v4.0代表了一个重要且有用的资源,用于研究miRNA在疾病中的作用。最后,HMDD将根据医学miRNA领域的新条目和新主题进行持续更新。

参考资料

Chunmei Cui, Bitao Zhong, Rui Fan, Qinghua Cui, HMDD v4.0: a database for experimentally supported human microRNA-disease associations, Nucleic Acids Research, 2023;, gkad717,

https://doi.org/10.1093/nar/gkad717

数据库地址

http://www.cuilab.cn/ hmdd

0 人点赞