今年1月2022Nucleic Acids Research生物数据库特刊上线,包含185篇文章:其中87篇论文报告了新数据库;85篇更新了该期先前发表的资源;13篇提供了最近在其他期刊发表的数据库的更新。
# 2022NAR特刊-单细胞数据库合辑 #
DISCO
DISCO是一个高度整合的单细胞组学数据库。当前版本的DISCO整合了来自4593个样本的超过1800万个细胞,涵盖107个组织/细胞系/类器官、158 种疾病和20个平台。其部署了三种在线工具,FastIntegration用于在线数据集成,CELLiD用于在线细胞类型识别,CellMapper用于在线细胞映射。这些工具使用户能够执行自定义数据集成,并上传自己的数据以进行细胞类型注释和映射到可用的图谱上。
数据库地址:
https://www.immunesinglecell.org/
huARdb
huARdb是首个基于单细胞免疫组测序的人类T细胞受体(TCR)和B细胞受体(BCR)的数据库。其收集了215份单细胞免疫组库数据,这些数据来自于493个不同的测序文库, 24种不同组织和12种不同疾病模型。研究团队还开发了一个多功能、用户友好的web界面,为生物学家提供交互式可视化模块,以便在单细胞水平上分析各数据集的转录组和TCR/BCR相关特征。
数据库地址:
https://huarc.net/database
scEnhancer
scEnhancers是一个单细胞增强子数据库,涵盖了三个物种775种组织/细胞类型的1196906个单细胞的14527776个增强子和63658600个增强子相互作用。其提供了一个用户友好的平台,包含七个功能模块用于搜索、可视化和浏览增强子/基因。该数据库将促进研究界在单细胞水平上对增强子进行功能分析。
数据库地址:
http://enhanceratlas.net/scenhancer/
scAPAdb
scAPAdb是一个单细胞选择性多聚腺苷化数据库。提供了单细胞水平全基因组poly(A)位点、APA事件和poly(A)信号图谱。scAPAdb从超过360个scRNA-seq实验中收集APA信息,涵盖包括人类、小鼠、水稻、拟南芥等六个物种。scAPAdb还提供数据批量下载,用户可以通过基因标识符、基因功能、索引号等多种关键词查询数据库。
数据库地址:
http://www.bmibig.cn/scAPAdb/
CancerSCEM
癌症单细胞表达图谱数据库(CancerSCEM)1.0版本整合分析了208个癌症scRNA-seq数据集,涵盖肺腺癌(LUAD)、结肠直肠癌(CRC)、恶性胶质瘤(GBM)等在内的20种人类癌症类型。其为用户提供浏览、多重检索、在线分析及下载等服务功能,用户可采用首页的快速检索、词云及精确检索等途径查询感兴趣的癌症单细胞数据集或样本。此外,CancerSCEM还配备了一个交互式综合在线分析平台,共集成2个分析模块与7个分析功能。
数据库地址:
https://ngdc.cncb.ac.cn/cancerscem/
scMethBank
scMethBank是第一个致力于单细胞全基因组DNA甲基化数据收集、整合、分析和可视化的综合性数据库,当前版本包括来自15个公共单细胞数据集的亚硫酸氢盐测序数据和人工审编的元数据8328个,涉及两个物种(人和小鼠),9 种细胞类型和两种疾病,提供浏览、搜索、可视化、下载功能和用户友好的在线工具。
数据库地址:
https://ngdc.cncb.ac.cn/methbank/scm/
SCovid
SCovid旨在提供一个全面的单细胞数据资源。当前版本的SCovid记录了10个人类组织的21个单细胞数据集的1042 227个单细胞,11 713个稳定表达的基因和3778个重要的差异表达基因(DEGs)。SCovid还提供了一个用户友好的界面,用于浏览、搜索、可视化和下载所有的详细信息。
数据库地址:
http://bio-annotation.cn/scovid
VThunter
VThunter是一个专为病毒学研究设计的综合数据库。开发团队手动整理了动物scRNA-seq研究中产生的最新数据集,使用统一的处理流程对其进行分析,并对142种病毒中的107种病毒受体进行了综合注释,并在47种动物的210962个细胞中获得了准确的表达特征。VThunter为研究界探索病毒受体的表达特征提供了一个用户友好的界面。
数据库地址:
https://db.cngb.org/VThunter/
# CNGBdb 单细胞数据递交和可视化平台 #
CDCP
CDCP是一个单细胞数据集成、共享、分析的综合平台。其主要功能包括:1. 用户可以在线获取CDCP收录数据集中样本的详细信息,并允许下载每个单细胞数据集的原始序列和表达矩阵;2. 与UCSC单细胞浏览器和ASAP等其它平台不同,CDCP提供了一个共享和集成单细胞转录组学数据集平台,并允许用户上传数据,可以实时更新;3. CDCP允许使用tSNE细胞降维图、不同细胞类型的聚类分析图以及显示不同细胞类型数量的直方图对每个单细胞数据集进行可视化,其中多个基因在不同细胞类型或簇中的表达模式可通过聚类图和小提琴图显示。此外,CDCP还提供一个用户友好的分析流程,通过提供单细胞表达矩阵,用户可以在线对感兴趣的细胞数据集进行重新分析,包括数据质控、注释高度可变基因、降维/聚类、分析用于表征群体特征的标记基因等。
数据库地址:
https://db.cngb.org/cdcp/