SCmut||分析单细胞数据突变

2020-09-03 09:43:15 浏览数 (1)

单细胞RNA测序(scRNA-seq)和DNA测序(scDNA-seq)都可以应用于细胞水平基因组分析。对于突变分析,scDNA-seq似乎更常见。然而,这项任务是非常具有挑战性的,只有两份拷贝DNA分子作为输入十分有限,而全基因组扩增则会产生偏差和其他技术噪音。scRNA-seq通常具有更大的数据量和更好的数据质量。但目前DNA测序中检测突变的方法多种多样,尚不清楚这些方法是否可以用于scRNA-seq数据。

对Bulk RNAseq或scDNA-seq数据开发的突变检测方法不适用于scRNA-seq数据,因为它们会产生过多的假阳性。因此,作者开发了一种新的、稳健的统计方法——称为SCmut,来识别特定的突变细胞。他们将SCmut应用于几个scRNA-seq数据集。在scRNA-seq乳腺癌数据集中,SCmut可以识别许多高度可信的细胞水平突变,这些突变在许多细胞中都反复出现,并且在不同样品中保持一致。在scRNA-seq胶质母细胞瘤数据集中,发现PDGFRA基因中的复发性细胞水平突变与该基因中众所周知的框内缺失高度相关。

简而言之,该方法首先从肿瘤和匹配的种系组织的大细胞DNA测序(bcDNA-seq)中收集体细胞突变。然后,结合从scRNA-seq中提取的单个细胞的single-nucleotide variants (SNV),SCmut使用二维局部错误发现率(2D local fdr)方法在细胞水平上统计检测体细胞突变。将该方法应用于(i)两名乳腺癌患者的几个scRNA-seq数据集,(ii)乳腺癌细胞系MDA-MB-231的两组细胞,以及(iii)胶质母细胞瘤细胞的一组。在(i)中,发现的细胞水平突变在肿瘤细胞和非肿瘤细胞之间被很好地分开,在(ii)中,突变被同时在两个独立的数据集中发现。在胶质母细胞瘤数据集(iii)中,我们发现了与PDGFRA基因中众所周知的24 bp读框内缺失高度相关的细胞水平突变。

原文:https://pubmed.ncbi.nlm.nih.gov/31028395/

0 人点赞