cytof数据处理工具大比拼

2022-01-10 08:41:25 浏览数 (1)

2019的文章,Liu et al. Genome Biology,标题是;《A comparison framework and guideline of clustering methods for mass cytometry data》,在6个数据集上面,测试了9种算法的表现。

9种算法工具分别是:

  • Seven unsupervised methods (Accense, Xshift, PhenoGraph, FlowSOM, flowMeans, DEPECHE, and kmeans)
  • two semi-supervised methods (Automated Cell-type Discovery and Classification and linear discriminant analysis (LDA))

各个算法工具的详细介绍如下所示 :

可以看到, 不同工具的开发语言大不一样,其实这样的比较哪怕是告诉我那个MATLAB开发的工具多么的有优势,我也不想去使用,毕竟新学一门语言还是压力有点大。

6个数据集是:

  • three well-annotated bone marrow datasets (Levine13dim, Levine32dim, Samu- sik01)
  • two datasets for muscle cells [28] and in vitro cell lines (Cell Cycle) [29],
  • one of our own experimental datasets on colon cancer

主要的评价指标包括:(accuracy, F-measure, NMI, ARI),

最后的结论是:每个人工具都有各自的优缺点,如下所示:

不过;PhenoGraph and FlowSOM are the top-performing unsupervised tools

如果你是第一次接触cytof数据,可以看我在《生信技能树》发布了cytof这样的质谱流式数据处理系列文字版教程,就是基于 FlowSOM 哦 :

  • 1.cytof数据资源介绍(文末有交流群)
  • 2.cytofWorkflow之读入FCS文件(一)
  • 3.cytofWorkflow之构建SingleCellExperiment对象(二)
  • 4.cytofWorkflow之基本质量控制(三)
  • 5.cytofWorkflow之聚类分群(四)
  • 6.cytofWorkflow之人工注释生物学亚群(五)
  • 7.cytofWorkflow之亚群比例差异分析(六)

只需自己准备好FCS格式的数据文件,后续全部的R里面的统计可视化。再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理

  • 生信分析人员如何系统入门R(2019更新版)
  • 生信分析人员如何系统入门Linux(2019更新版)

把R的知识点路线图搞定,如下:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)
  • 文件读取和写出
  • 简单统计可视化
  • 无限量函数学习

0 人点赞