复制粘贴就能运行的100套R实战演练代码也有错误

2022-06-27 21:04:51 浏览数 (1)

前面整理了100多套R代码,因为时间跨度有点长,而且公众号写作后没办法修改,所以安排实习生进行代码审查,看看是不是确实复制粘贴就可以运行。

一定是对我们《生信技能树》爱得深沉,才会在这大过年的时间段收藏我们下面的目录,并且一个个点开,复制粘贴我的代码去自己的电脑里面的Rstudio运行并且理解吧!

  • 基于基因集的样品队列分组之gsea等打分
  • 基于基因集的样品队列分组之层次聚类
  • 基于基因集的样品队列分组之PCA
  • 不正常的illumina芯片数据如果使用lumi包的lumiR.batch函数读取会失败

果不其然发现了不少bugs

100. 4个基因如何做go和kegg数据库注释

运行最后报错,前面的代码并没有pro,需要自己随意赋值即可

99. 从R绘图入门看R语言学习方法论

运行下面这句代码的时候遇到了报错,但是我把devtools包删除后重新装了一下,再运行就可以了,不知道是不是这个原因,也有可能是网络不稳定?代码本身没有问题,也有看到网上有人说遇到类似报错先运行options(timeout=300),增加timeout再进行install。

不同地区的小伙伴安装GitHub包会有不同的困难,目前无解

96 有必要把不同的染色体差异基因使用圈圈图展示么?

1、airway应该是一个S4对象,但是环境变量显示Object with null pionter,虽然不影响后面的运行,每运行一句都会warning,但是总觉得怪怪的,我还没有找到解决问题的办法,还是本身这个内置数据就是这样的

2、拿到filter_count后,进行DESeq2分析前少了一句代码 ,所以出现报错

代码语言:javascript复制
exprSet <- filter_count

3、这句代码在画圈圈的部分,因为第一步结束的时候并未存成R.data,在第一步结束时save一下就好了

4、这个问题可能并不是所有人都会遇到,出现这个报错的原因是我电脑上ggplot2是3.3.6版本,而这里要求3.3.5,我把3.3.6版本卸载后,重新指定版本安装就搞定啦~

附带个人想法:我觉得圈圈图比较美观,但是信息量不大,火山图的信息量相对大一些。

95. 使用DEseq2做转录组测序差异分析的时候顺便去除批次效应

1、引入批次效应

代码想要实现的是"我们对b1批次的4个样品,随机抽取1000个基因干扰它的表达量,算是模拟了一个批次效应",但是这里好像是对b1组全部基因都加了100,而不是随机抽取1000

代码语言:javascript复制
ct_with_batch = filter_count
x= sample(1:nrow(ct_with_batch))
y = which(batch=='b1')

ct_with_batch[x,y] = ct_with_batch[x,y] 100
dat=log2(edgeR::cpm(ct_with_batch) 1)
ht_for_RNAcounts(dat)

2、这篇文章里并没有做正常表达量矩阵的常规分析,这个应该是之前做好的.Rdata。这一步需要读者自己生成文件后再接着做后续分析,不过跑一下也很快的。

3、对人为引入的批次效应的表达量矩阵走常规差异部分,只做到了提取差异分析结果,缺失设置上下调基因等后续部分代码。

94. 在Mac或者Linux上面安装velocyto.R的成功经验分享

我按照方法依然装不上,已经解决了hcc的问题,关于boost,我这边显示已经安装上了,但R上面进行velocyto安装时依然报错,我还需要再努力研究看看。

尝试了一堆方法之后,开始报错如下,不知道是不是跟我电脑M1芯片有关,暂时放弃了

91. 相关性分析返回相关性系数的同时返回P值

1、因为之前没有安装"psych"包,所以开始安装这个包,发现目前的R版本装不了最新版本的Psych包,所以去CRAN网上查看了一下,发现5月10日时作者更新了包到2.2.5,所以又去查了这个包的历史版本,指定安装了2.2.3版本的R包,安装之后报错少了"mnormt"包,又去装了mnormt,最后成功安装psych包,

2、corr.test 这个函数需要两个矩阵X与Y的行数完全一致,我将两个矩阵转置后,都是500行,就可以了

3、for循环部分,两个矩阵的名字与之前不一样

87 不正常的illumina芯片数据如果使用lumi包的lumiR.batch函数读取会失败

这里突然出现了pd,我去研究了一下,是临床信息里的title列,需要获取临床信息的title列才会与正常illumina芯片数据使用lumin包lumiR.batch函数读取的列明信息完全一致。

85 你不需要真的这个包,而仅仅是需要它里面的数据

看到文章中提到的是Deseq的问题,但是我遇到的报错如下

随后,我将DESeq与IMvigor210CoreBiologies两个包下载到本地安装,又又出现了之前安装velocyto.R的报错。

73. 有了风险因子森林图为什么还需要列线图

画风险森林图时没有library(survminer)

画诺谟图时library(rms)位置在这句代码之后,没有library(rms)包

69. 学徒笔记——芯片数据的注释文件获取

1、这个GPL17692目前已经有注释文件啦

2、注释没有标#

3、前面用的是ids,这里突然变成了deg,改一下就好

57. 3个分组的表达量矩阵的两两之间差异分析

1、pheatmap(y)代码被注释

56. 一个bioconductor包居然发在了cancer research杂志

1、data(fluidigm)显示not found ,换成fluidigm <- ReprocessedFluidigmData()可以

2、没有library(monocle)

3、将raw.data改成counts,不然会报错,这可能跟版本有关吧

25. 使用R语言展示我们生信技能树全国巡讲的征程

依稀记得小洁老师上课的时候说,目前这个图现在已经做不了了,不知道是不是这个包的原因

22. 程序员的浪漫--R语言画小心心

21. 30道练习题带你玩转统计学的R语言版

1、统计检验相关部分:需要先data(airway)

包安装时出问题,后检查发现hugene10sttranscriptcluster.db少了".db",所以报错

19. 生信人应该这样学R语言系列视频学习心得笔记分享

根据报错,改成dplyr::filter就可以啦

小洁老师的关于10题的答案,由于有些数据集需要下载和整理,我还没有做完。

18. 使用methods函数来查看R语言里面的对象的操作方式

14. 没有数据集,就没有跑

2. 用R语言做逻辑回归

目前这个网址已经无法下载,所以没有跑后续的流程

0 人点赞