单细胞学习小组最后一天的课程,关于GSVA和细胞通讯。
GSVA
单细胞数据的GSVA和芯片、bulk转录组的GSVA没有本质区别,就使用AverageExpression获取平均表达量得到新的表达矩阵再计算即可。
GSVA分析的全名叫Gene Set Variation Analysis,能够分析基因集/通路的活性程度。
看到一个对GSVA的解释,非常生动形象:
我们有一堆基因,就像一群小精灵,它们有的勤奋,有的懒惰。GSVA的任务就是告诉我们哪些小精灵在哪些情况下(样本的差异)可以激励他们劳作,变得勤奋(基因表达量高)。GSVA会拿着一个名单,上面写着不同的情况,比如不同的细胞类型或疾病状态。然后,它会检查每个基因是否在这些情况下表现得更好或更差。最后,GSVA会把结果告诉我们,告诉我们哪些情况下哪些基因变得更活跃。这对于研究基因与疾病之间的关系或了解不同细胞类型的功能非常有帮助的哦。
细胞通讯
细胞通讯是单细胞数据高级分析中比较常见的一个,我们习惯使用的R包是CellChat。
这个是CellChat的一手教程:
https://htmlpreview.github.io/?https://github.com/jinworks/CellChat/blob/master/tutorial/CellChat-vignette.html
细胞通讯(CCC)指发生在分泌配体蛋白和受体蛋白之间对互作过程,对稳态、发育和疾病过程具有重要作用。推断细胞通讯对软件可以分为两类,分别是独立预测细胞通讯和额外预测细胞内事件。独立预测细胞通讯的软件包括CellChat和CellPhoneDB等,它们预测介导细胞通讯的受体配体对。额外预测细胞内事件对工具包括NicheNet等,它们不仅预测介导细胞通讯的受体配体对和关联的基因调控网络。
独立预测细胞通讯的软件输入为单细胞转录组中的基因表达信息,同时输入细胞需要进行聚类以及注释。此时这些软件能够预测任意两个细胞群之间的细胞通讯,其中一个是细胞通讯的来源,另一个是细胞通讯的目标。在此场景下,细胞通讯事件指一个细胞类群分泌配体蛋白,被另一个细胞类群的受体蛋白