因为想看PRC1基因在肺癌的作用,研究者就在肺癌细胞系里面敲减了PRC1基因,然后做了一个常规的转录组,数据分析部分的描述是 :
- To investigate the molecular mechanism underlying the oncogenic role of PRC1 in lung adenocarcinoma, we utilized NGS to assess the gene expression profiles of PRC1-depleted A549 cells and control cells.
- This un- biased genome-scale analysis identified 10,037 differen- tially expressed genes (DEGs) [log2(FoldChange)] > 1 and P < 0.05) in A549 cells after PRC1 knockdown com- pared to controls.
首先这个阈值就好奇怪,他这个表达量矩阵里面基因数量大概就是两三万,就一万多个基因被判定为统计学显著的差异基因,这个暂且不说它什么了。然后研究者就对着一万多个基因合并去做kegg注释,挑选注释得分最高的Wnt通路为目标:
- The pathway analysis showed that the Wnt/β-catenin, TGF- β, Hippo, p53, MAPK and cell cycle pathways were significantly enriched from downregulated DEGs (Fig. 8b and c).
- The Wnt/β-catenin pathway was the most significantly dysregulated in re- sponse to PRC1-depeletion.
- An expression heatmap of 44 Wnt/β-ca- tenin pathway relevant DEGs after the transduction of shPRC1–1 is shown in Fig. 8c.
全部的图表如下所示:
火山图,富集注释,热图
虽然是对着一万多个基因合并去做kegg注释,但是挑选到的Wnt通路的基因都是在敲减组表达量下调的,相当于原始肺癌细胞系来说。
这个转录组数据并没有公开,所以我猜测这个课题组应该是不怎么懂测序和生信,最后加上了 RT-PCR 和 Western blot 来说明这个Wnt通路的基因的下调的。
文章比较早啦,是2017的 《PRC1 contributes to tumorigenesis of lung adenocarcinoma in association with the Wnt/β-catenin signaling pathway》
目前简单的差异分析流程,基本上转录组测序技术和芯片技术拿到的表达量矩阵后续分析大同小异,公众号推文在:
- 解读GEO数据存放规律及下载,一文就够
- 解读SRA数据库规律一文就够
- 从GEO数据库下载得到表达矩阵 一文就够
- GSEA分析一文就够(单机版 R语言版)
- 根据分组信息做差异分析- 这个一文不够的
- 差异分析得到的结果注释一文就够
如果这个文章给出来了表达量矩阵,倒是可以把这个转录组数据分析演练一遍给大家看。