先申明,只是说可以,但是并不推荐这样做!!!
很多benchmark文章推荐做RNA-seq的时候,每个处理最好是做5个以上的重复,当然,研究者为了节约经费,通常只做3个重复,更有甚者做两个也行。但是只做一个,往往就麻烦了,因为没办法进行常规的统计学检验看处理前后的差异表达的显著性。
但是2018年二月的一篇文章,仍然是不做重复,文章是: Transcriptional Regulation of the Warburg Effect in Cancer by SIX1
文章背景
这个转录因子 sine oculis homeobox 1 (SIX1) 在器官发育过程起着非常重要的作用,如下:
- Six1 knockout (KO) mouse embryos have defects in several organs
- Six1 KO mice die shortly after birth. SIX1 is overexpressed in many cancers
- Increased SIX1 expression predicts poor clinical outcomes.
- SIX1 can promote tumor growth and metastasis.
以前没有SIX1基因在cancer metabolism的研究,所以作者探究 它,如下:
To identify SIX1 downstream effectors, we performed RNA sequencing(RNA-seq) using SIX1 stable knockdown (KD) ZR75-1 breast cancer cell line or control cell line.
发现了1900个受SIX1基因调控的基因,这个转录组数据上传到了GEO,GSE93925 所以我看了看,赫然发现,居然只有两个样本。
但是作者对这1900个受SIX1基因调控的基因做KEGG富集分析,发现了 他想要的 glycolysis pathway被富集出来。
所以作者挑选感兴趣的基因看了看热图;
而且,更重要的是用了 Real-time RT-PCR confirmed the altered expression of known SIX1 target genes and 11 glycolysis-related genes 这样的实验验证。
而且作者的转录组数据分析结果与2009年的一个 MCF7 breast cancer cellsoverexpressing SIX1芯片数据比较了
虽然转录组测序只做了一个,但是实验环节,都是5个重复的。
Moreover, compared with SIX1 WT ZR75-1 cells, SIX1 KO cells generated by CRISPR/Cas9showed markedly reduced GLUT1, HK2, PFKL, ALDOA, GAPDH, PGK1, ENO1, PKM2, and LDHA, but not GPI and PGAM1, at the mRNA and protein levels
那么给大家留几个问题:
- 转录组测序是测序深度重要还是生物学重复重要呢?比如,100M的reads测一个样本,还是选择测2个样本,每个样本是50M的reads呢?
- 生物学重复是3个最佳吗?这个数字是咋来的呢?或者6更佳?