Galaxy生信云平台|制作临床信息表/三线表/Table 1

2023-10-25 09:17:00 浏览数 (1)

临床基线表是在临床研究中用于记录和收集患者初始诊断、治疗前的基本信息以及其他关键变量的表格或数据库。这些基本信息通常被用作研究的起点,用于建立患者的初始状态或基线状态。

本文介绍通过Galaxy生信云平台 usegalaxy.cn 制作临床基线表/三线表的方法。

1. 数据准备

要制作临床基线表/三线表,首先要将临床信息整理成表格:

  • 每一行是一个样本;
  • 每一列是一个变量。

比如:

本文将以平台自带的一个测试数据集(tableone_pbc.tsv)为例进行演示。

2. Galaxy平台操作步骤

2.1 选择工具

  • 进入Galaxy生信云平台:usegalaxy.cn(建议使用Chrome或Firefox浏览器)。
  • 主页左侧工具列表中,找到 Statistics > 临床基线表,点击进入工具界面。

2.2 选择测试数据集

点击输入数据最右边按钮 Browse datasets > Data libraries > Table data > tableone_pbc.tsv,如图:

2.3 运行工具

完成数据集的选择后,我们保持其他参数设定框为空,以默认参数运行工具:

2.3 查看结果

点击眼睛图标,查看计算结果:

结果展示:

2.4 下载结果

点击显示数据详情:

点击磁盘图标下载结果文件:

结果是一个文本文件,可以用文本编辑器或者Excel打开:

3. 调整参数重新计算

在Galaxy平台上重新调整参数再次运行工具是非常方便的,只需要点击界面中的“重运行”按钮:

可以看到,界面中出现了刚才运行任务时的参数设置,也就是说,当重新运行任务时,上一次运行的参数得到了保留,我们只需要进行必要的修改,即可再次运行工具。

进行必要的修改,如:

  • 指定一个分类变量:sex
  • 指定两个符合正态分布的变量:trig, platelet(仅仅是用于举例,实际要依变量的性质而定)
  • 指定两个不符合正态分布的变量:time, age(仅仅是用于举例,实际要依变量的性质而定)
  • 指定两个分类变量:status, trt。当分类变量以数值表示时,必须明确指定其为分类变量,否则会自动按数值变量处理。

再次点击 Run Tool 运行,查看结果:

可以看到:

  • 对于符合正态分布的变量,计算了平均数和标准差:mean(SD)
  • 对于不符合正态分布的变量,计算了中位数和上下四分位数:median(IQR)
  • 对于分类变量,计算了它们的数量及其中总数中的百分比(%),以数值表示的分类变量得到了正确的处理

此外,表中还展示了 p 值 ,关于检验方法:

  • 正态分布的数据,进行了参数检验
  • 不符合正态分布的数据,进行了非参数检验
  • 分类数据,进行了Fisher精确检验

限于篇幅,本文就介绍到这里,更多生信工具,请到Galaxy生信云平台 usegalaxy.cn 网站进行探索。

3. 最后

生信分析已经进入2.0时代,即云平台时代。

Galaxy生信云平台 usegalaxy.cn 致力于降低生信分析门槛,将许多常见的生信分析都放到云上,用户无需安装本地软件或R包,只需要上传数据,点击鼠标即可进行生信分析。

0 人点赞