00 文章信息
英文标题: toxFlow: A Web-Based Application for Read-Across Toxicity Prediction Using Omics and Physicochemical Data
中文标题: toxFlow:一个基于web的应用程序,用于使用组学和理化数据进行毒性预测
期刊:《J. Chem. Inf. Model.》
影响因子: 4.951 发表时间: 2018-02-26
研究领域: GSVA 网页工具
DOI: 10.1021/acs.jcim.7b00160
01 概括
研究人员将纳米材料毒性预测的常规方法和GSVA富集分析方法相连,提出了一种新的预测纳米材料NPs毒性的方法,并做了网络工具toxFlow。
toxFlow可以联合或单独处理组学和物理化学数据,并可以进行数据过滤、可视化和结果导出。
02 背景
GSVA
GSVA,Gene Set Variation Analysis 基因集变异分析。GSVA 方法的第一篇文章发表于2013年:GSVA: gene set variation analysis for microarray and RNA-Seq data | SpringerLink。主要用于评估芯片和转录组的基因集富集结果,了解感兴趣的基因集在不同样品间的差异,评估潜在的通路活性变化。
GSVA输入文件:
- 标准化的表达矩阵或者RNA-seq count(a gene expression matrix in the form of log2 microarray expression values or RNA-seq counts)
- 基因集(a collection of gene sets)
输出文件:
结果表,列为样本,行为基因集名称。
优点:
该分析方法的结果可以使用传统的分析方法进行后续分析,如聚类分析,相关性分析,或将数据进行通路激活和抑制分组后进行生存分析。也可以使已知样本在通路和其他数据类型(microRNA expression or binding data, CNV data, or SNPs)之间进行比较。
纳米材料相关
部分纳米材料(NPs,nanoparticles)对人产生毒性。目前,针对化学品的QSAR建模方法已经成功地应用于预测NPs的毒性,并称为nanoQSARs 。nanoQSAR模型是用于预测结构和性能之间的定量关系。建立nanoQSARs 的前提是有高质量的实验数据,如果数据有限,则一般使用评估NPS毒性的另一种非检测方法:Read-Across,是一种利用单一或一组具有相似特征的NPs的信息预测未检测NPs的不良影响的方法。【类似比对】
NPs可以通过许多不同方面进行表征,如暴露途径、材料类型(如富勒烯、碳纳米管、金属氧化物等)、物理化学特性(如大小、形状、表面积、溶解度等)、生物物理相互作用和生物影响(如蛋白质和脂类冕的形成、基因表达、细胞和器官反应)、生命周期分析和生物动力学特性。
03 流程
- 数据标准化:研究人员建议将数据归一化
- GSVA分析
- NPs的相似性分析
- NPs的毒性预测
GSVA分析可以单独使用,我们在此处也只关注GSVA网页工具。
04 GSVA网页工具使用
输入数据:两个CSV文件
- 包含多个NPs的组学数据(基因或蛋白质名称的Accession ID);
- 包含NPs的分类。
研究人员准备了两个与NPs毒性相关的gene set,如果要用于生物分析,需要自己准备gene set。
研究人员设置了三个参数:
- GSVA执行次数:the number of bootstrap iterations to be performed by GSVA;
- 最大值及最小值:the maximum and minimum size of the resulting gene sets;
- p值范围:the threshold of the adjusted p-value
其结果是:一个包含所有具有统计意义的基因集的数据表,还有热图及相应的非循环图来描述重要基因集之间的层次关系。
网页界面
上图展示的是可以自己上传文件的界面,需要两个csv和一个gene set文件,并且研究人员要求必须上传Data classification(包含分组信息及临床性状)和Biological data(列为样本,行为基因)才能继续进行GSVA分析。如果站在研究人员分析预测NPs毒性的角度,这个要求是必要的。
另外,该网页工具是拿shiny做的。如果想学习,可以见:「生信技能树」shiny网页工具。