单细胞转录组测序(scRNA-seq)已成为鉴定和表征细胞类型、状态、谱系和网络的核心工具。Get单细胞技术也成为科研人的必修课。
如何快速入门单细胞?小编将从测序方法、数据分析流程、常用数据库介绍三方面帮你整理单细胞入门基础知识。
01单细胞测序方法该如何选择?
随着新方法的不断发展和现有方法的改进,scRNA-seq仍然是一个快速发展的领域。然而,这些方法还没有得到系统和全面的基准测试。来自美国的研究团队在《Nature Biotechnology》发表文章,选择了7种不同scRNA-seq方法,包括两种低通量方法(Smart-seq2和CEL-Seq2)和五种高通量方法(10x-Chromium、Drop-seq、Seq-Well、inDrops和sci-RNA-seq),对三种不同类型的样本(人类和小鼠细胞系混合样本、人类外周血单核细胞(PBMCs)和小鼠皮质核)进行了系统性的比较。
研究概述
read结构和基因组结构比对率
Smart-seq2的2次实验和inDrops的1次实验中exonic reads比例最高(分别为51.0%、53.7%和56.9%),sci-RNA-seq表现最差(28.7%和29.4%)。总的来说,与混合物样品相比,PBMC样品整体exonic reads比例低,inDrops的1次实验中exonic reads比例最高(46%),Seq-Well(20%)。与细胞相比,在细胞核内intronic reads比例更高。
灵敏度
综合来看低通量方法Smart-seq2和CEL-seq2的灵敏度最高,而在高通量方法中,10x-Chromium检测到的UMIs和每个细胞的基因最多。
在混合样品中,inDrops的灵敏度最低,CEL-Seq2灵敏度最高,Seq-Well在每个细胞中检测到的基因比10x-Chromium(v2)和sci-RNA-Seq少,但在每个细胞中检测到的基因比Drop-Seq和inDrops多。当比较每个细胞检测到的UMI的中位数、每个细胞检测到的基因或每个细胞检测到的平均reads时,这些方法的相对排名基本没有发生变化。
在PBMCs样本中,低通量方法比高通量方法检测到更多的UMIs和基因,Smart-seq2(检测到的基因中位数为2406和2632)和CEL-seq2(2717和2545)的性能相似。在高通量方法中,10x-Chromium(v3)细胞UMIs中位数 (4,494)和基因中位数 (1,482) 最高,inDrops(366和1118 UMIs;256和568个基因)和Seq Well(844和577 UMIs;513和372个基因)的中位数最低。
在皮质细胞核样本,Smart-seq2是唯一被测试的低通量方法,测序的深度略高于其他样本,并使用了所有的reads。正如预期的那样,Smart-seq2比高通量方法在每个细胞中检测到更多的基因。在高通量方法中,10x-Chromium(v2)细胞UMIs中位数(5126和3127)和基因中位数(2462和1744) 最高。
多细胞率比较
混合样本单细胞实验中能够评估多细胞率(2个及2个以上细胞聚合在一起被当成1个细胞捕获),除了第一次inDrops实验以外,所有7种方法的多细胞率均<3.5%。研究人员还使用混合样本来检验在一个细胞中检测到的基因是否真的来自该细胞,而不是来自其他细胞的“污染”。随着测序深度的增加,从“错误”物种中检测到更多的基因,此指标反映在每个轴对应的细胞Barcode回归线的斜率上,因此表现最好的方法具有最低的斜率。对于低通量方法,Smart-seq2比CEL-seq2表现得更好。在高通量方法中,inDrops的斜率最好(最低),Seq-Well的斜率最高。
技术精密度
除Smart-seq2之外,其余6种方法的精密度均表现良好。
以往的研究表明,技术变异一般遵循泊松分布。CEL-seq2、inDrops和Drop-seq的额外泊松变异系数相对较低,这与之前的研究一致。Smart-seq2数据具有最高的额外泊松变异系数,原因很可能是因为没有使用UMIs
区分和重现细胞类型的能力
对于PBMCs,不同scRNA-seq方法在区分细胞类型的能力、重现的细胞类型比例以及某些情况下某些细胞类型的重现方面各不相同。正如预期的那样,这些方法在区分转录相关的细胞类型方面有更大的困难,例如CD4 T细胞、CD8 细胞毒性T细胞和自然杀伤细胞。从PBMC2的t-SNE图中,观察到10X- Chromium和inDrops表现良好。
由于每个实验的所有文库都是从同一个样本生成的,因此研究人员评估了在一个实验中分配给每个细胞类型的细胞比例的方法之间的一致性。一般来说,大多数方法成功地重现了PBMCs中丰富的细胞类型,但细胞类型的相对丰度不同。对于低通量方法,由于捕获不到足够的细胞而不能重现样本中的罕见细胞。高通量方法中,10x Chromium(v2)在鉴定的细胞类型数量和跨细胞类型的平均AUC中显示出最好的质量,其次是Drop-seq和10x Chromium(v3),而Seq-Well和inDrops各自均无法识别到两种细胞类型。在PBMC2样本中,10x Chromium(v2)和inDrops表现最好,鉴定到了所有细胞类型。
与PBMCs相似,小鼠皮层有明确的细胞类型,包括兴奋性和抑制性神经元、星形胶质细胞、少突胶质细胞、少突胶质祖细胞、小胶质细胞、内皮细胞和周细胞。在所有方法的两次实验中,除了sci-RNA-seq外,所有方法都可以鉴定除周细胞以外的所有细胞类型,周细胞仅在DroNc-seq (Cortex1)中被发现。在sci-RNA-seq数据集中,也找不到少突胶质祖细胞和小胶质细胞。在AUC分析中,Smart-seq2、10x-Chromium(v2)和DroNc-seq均具有较高的AUC,尽管它们检测预期细胞的相对能力因细胞类型而异。值得注意的是,与PBMC数据集相比,即使Smart-seq2数据集中的少量细胞(295和349)也足以找到这些细胞类型。
操作时间和成本
除了性能,研究人员还比较了每种方法的操作时间和试剂成本。Drop-seq、seq-Well和inDrops的成本最低,Smart-seq2的成本最高。许多方法,尤其是sci-RNA-seq,在单细胞或细胞核数量较多的情况下更具成本效益。10x-Chromium所需时间最少,Smart-seq2、CEL-seq2和inDrops所需时间最多。
此项研究既为每种方法的相对性能提供了直接的指导,也为评估未来的技术提供了实验和计算框架。对于低通量方法,Smart-seq2和CEL-seq2的表现类似,尽管后者可能更容易受到来自其他细胞的污染影响。在高通量的方法中,10x-Chromium的效果最好。