ARACNE算法从表达谱数据中推断基因调控网络

2023-12-24 10:42:08 浏览数 (2)

2022年在圣母大学组织的关于网络生物学未来方向的研讨会上,生物网络的推理和比较作为重要的研究方向,越来越多的被用于标记物的筛选与分子机制的研究。最近比较火热的viper实现单细胞蛋白活性推断,也是基于ARACNE算法构建的调控网络。

调控网络推断(图片来自https://arxiv.org/abs/2309.08478 )调控网络推断(图片来自https://arxiv.org/abs/2309.08478 )

Reconstruction of Accurate Cellular Networks(ARACNE)算法于2006年发表在BMC Bioinformatics杂志,其升级版ARACNE-AP于2016年发表在Bioinformatics杂志,具体信息可以查询(https://github.com/califano-lab/ARACNe-AP)

一.程序输入

    程序输入主要包括表达谱矩阵与转录因子列表,表达谱矩阵按照列为基因名字,行为样本名字,其他为表达值(比如RPKM),转录因子列表为一列转录因子的名字。

二、程序分析

主要分为3个步骤:

1.计算 相互信息(MI)阈值

    java -jar -Xmx5G ARACNe-AP/dist/aracne.jar -e TCGA-STAD.txt -o ARACNe --tfs human_tf.txt --pvalue 1E-8 --seed 1 --calculateThreshold

会输出

    Finding threshold for 375 samples

    Parameters for fitted threshold function: 

    [0.06920274338285985, 6.225412313393141E-6]

    MI threshold: 0.07966707223888007

2.循环100次抽样筛选显著的MI

    for i in {1..100};do java -jar -Xmx5G ARACNe-AP/dist/aracne.jar -e TCGA-STAD.txt

-o ARACNe --tfs human_tf.txt --pvalue 1E-8 --seed $i --threads 64 ;done

3.进行一致性统计分析,筛选显著的Network

    java -jar -Xmx5G ARACNe-AP/dist/aracne.jar  -o ARACNe --consolidate --threads 60

三、程序输出

    输出结果包括三列,第一列为调控因子,第二列为靶基因,第三列为MI值,第四列为Pvalue值。

TCGA-STAD 计算结果TCGA-STAD 计算结果

四、结果应用

    ARACNE-AP计算的结果文件可以用于viper R包aracne2regulon函数进行调用。

0 人点赞