前面整理了100多套R代码,因为时间跨度有点长,而且公众号写作后没办法修改,所以安排实习生进行代码审查,看看是不是确实复制粘贴就可以运行。
一定是对我们《生信技能树》爱得深沉,才会在这大过年的时间段收藏我们下面的目录,并且一个个点开,复制粘贴我的代码去自己的电脑里面的Rstudio运行并且理解吧!
- 基于基因集的样品队列分组之gsea等打分
- 基于基因集的样品队列分组之层次聚类
- 基于基因集的样品队列分组之PCA
- 不正常的illumina芯片数据如果使用lumi包的lumiR.batch函数读取会失败
果不其然发现了不少bugs
100. 4个基因如何做go和kegg数据库注释
运行最后报错,前面的代码并没有pro,需要自己随意赋值即可
99. 从R绘图入门看R语言学习方法论
运行下面这句代码的时候遇到了报错,但是我把devtools包删除后重新装了一下,再运行就可以了,不知道是不是这个原因,也有可能是网络不稳定?代码本身没有问题,也有看到网上有人说遇到类似报错先运行options(timeout=300),增加timeout再进行install。
不同地区的小伙伴安装GitHub包会有不同的困难,目前无解
96 有必要把不同的染色体差异基因使用圈圈图展示么?
1、airway应该是一个S4对象,但是环境变量显示Object with null pionter,虽然不影响后面的运行,每运行一句都会warning,但是总觉得怪怪的,我还没有找到解决问题的办法,还是本身这个内置数据就是这样的?
2、拿到filter_count后,进行DESeq2分析前少了一句代码 ,所以出现报错
代码语言:javascript复制exprSet <- filter_count
3、这句代码在画圈圈的部分,因为第一步结束的时候并未存成R.data,在第一步结束时save一下就好了
4、这个问题可能并不是所有人都会遇到,出现这个报错的原因是我电脑上ggplot2是3.3.6版本,而这里要求3.3.5,我把3.3.6版本卸载后,重新指定版本安装就搞定啦~
附带个人想法:我觉得圈圈图比较美观,但是信息量不大,火山图的信息量相对大一些。
95. 使用DEseq2做转录组测序差异分析的时候顺便去除批次效应
1、引入批次效应
代码想要实现的是"我们对b1批次的4个样品,随机抽取1000个基因干扰它的表达量,算是模拟了一个批次效应",但是这里好像是对b1组全部基因都加了100,而不是随机抽取1000
代码语言:javascript复制ct_with_batch = filter_count
x= sample(1:nrow(ct_with_batch))
y = which(batch=='b1')
ct_with_batch[x,y] = ct_with_batch[x,y] 100
dat=log2(edgeR::cpm(ct_with_batch) 1)
ht_for_RNAcounts(dat)
2、这篇文章里并没有做正常表达量矩阵的常规分析,这个应该是之前做好的.Rdata。这一步需要读者自己生成文件后再接着做后续分析,不过跑一下也很快的。
3、对人为引入的批次效应的表达量矩阵走常规差异部分,只做到了提取差异分析结果,缺失设置上下调基因等后续部分代码。
94. 在Mac或者Linux上面安装velocyto.R的成功经验分享
我按照方法依然装不上,已经解决了hcc的问题,关于boost,我这边显示已经安装上了,但R上面进行velocyto安装时依然报错,我还需要再努力研究看看。
尝试了一堆方法之后,开始报错如下,不知道是不是跟我电脑M1芯片有关,暂时放弃了
91. 相关性分析返回相关性系数的同时返回P值
1、因为之前没有安装"psych"包,所以开始安装这个包,发现目前的R版本装不了最新版本的Psych包,所以去CRAN网上查看了一下,发现5月10日时作者更新了包到2.2.5,所以又去查了这个包的历史版本,指定安装了2.2.3版本的R包,安装之后报错少了"mnormt"包,又去装了mnormt,最后成功安装psych包,
2、corr.test 这个函数需要两个矩阵X与Y的行数完全一致,我将两个矩阵转置后,都是500行,就可以了
3、for循环部分,两个矩阵的名字与之前不一样
87 不正常的illumina芯片数据如果使用lumi包的lumiR.batch函数读取会失败
这里突然出现了pd,我去研究了一下,是临床信息里的title列,需要获取临床信息的title列才会与正常illumina芯片数据使用lumin包lumiR.batch函数读取的列明信息完全一致。
85 你不需要真的这个包,而仅仅是需要它里面的数据
看到文章中提到的是Deseq的问题,但是我遇到的报错如下
随后,我将DESeq与IMvigor210CoreBiologies两个包下载到本地安装,又又出现了之前安装velocyto.R的报错。
73. 有了风险因子森林图为什么还需要列线图
画风险森林图时没有library(survminer)
画诺谟图时library(rms)位置在这句代码之后,没有library(rms)包
69. 学徒笔记——芯片数据的注释文件获取
1、这个GPL17692目前已经有注释文件啦
2、注释没有标#
3、前面用的是ids,这里突然变成了deg,改一下就好
57. 3个分组的表达量矩阵的两两之间差异分析
1、pheatmap(y)代码被注释
56. 一个bioconductor包居然发在了cancer research杂志
1、data(fluidigm)显示not found ,换成fluidigm <- ReprocessedFluidigmData()可以
2、没有library(monocle)
3、将raw.data改成counts,不然会报错,这可能跟版本有关吧
25. 使用R语言展示我们生信技能树全国巡讲的征程
依稀记得小洁老师上课的时候说,目前这个图现在已经做不了了,不知道是不是这个包的原因
22. 程序员的浪漫--R语言画小心心
21. 30道练习题带你玩转统计学的R语言版
1、统计检验相关部分:需要先data(airway)
包安装时出问题,后检查发现hugene10sttranscriptcluster.db少了".db",所以报错
19. 生信人应该这样学R语言系列视频学习心得笔记分享
根据报错,改成dplyr::filter就可以啦
小洁老师的关于10题的答案,由于有些数据集需要下载和整理,我还没有做完。
18. 使用methods函数来查看R语言里面的对象的操作方式
14. 没有数据集,就没有跑
2. 用R语言做逻辑回归
目前这个网址已经无法下载,所以没有跑后续的流程