写在前面:从.CEL格式原始数据下载,到最终关键基因筛选(非hub基因)和初步验证,整个流程,目录还会增加。会涉及R及众多R包(最关键的是maSigpro和WGCNA),统计,ggplot2,cytoscape等。目标还是和前面的RNA-seq流程一样,你可以从头到尾一直重复下去。
内容会很长,最近事情多,更新会比较慢。感兴趣的可以按照这个思路去自己摸索。
目录
1:NCBI原始数据下载(直接下载或wget)
2: 原始数据下载后的整理
3:芯片质量控制
4:芯片数据预处理得到表达水平数据
5:基于maSigPro包时间序列差异表达基因(DEGs)筛选
6:DEGs的生物功能富集分析(GO KEGG):clusterprofiler包
7: 权重基因共表达网络的构建及分析(WGCNA)
8: 关键模块和关键候选因子筛选
- 8.1 hub基因的筛选(基于WGCNA)
- 8.2 差异基因PPI网络的建立和分析
- 8.3 可能的关键模块中候选关键基因分析
- 8.4 转录因子和microRNA分析
- 8.5 潜在关键基因的识别(功能未知或未注释基因)
9: 关键因子的初步验证
- 9.1
- 9.2
- 9.3