本版块会持续分享一些常用的结果展示的图形。
在得到数据之后,我们经常会用到维恩图来展示各个数据集之间的重叠关系。本文简单的介绍R语言中的VennDiagram包绘制数据集的维恩图。
一 需要安装和导入的包
代码语言:javascript复制install.packages("VennDiagram")
library(grid)
library(VennDiagram)
二 使用函数及参数
所有参数说明详见https://cran.r-project.org/web/packages/VennDiagram/VennDiagram.pdf,
可以看到参数有很多,不用担心,下文的例子会给出常用的调整参数以及说明。
三 知道各个数据集的个数以及重叠(交叉)的个数
2.1 两个已知数据集的韦恩图
代码语言:javascript复制# 圆的大小不会根据数据量多少改变
venn.plot <- draw.pairwise.venn(80, 30, 10, c("First", "Second"), scaled =FALSE)
grid.draw(venn.plot)
# 圆的大小根据数据量多少改变
venn.plot <- draw.pairwise.venn(80, 30, 10, c("First", "Second"))
grid.draw(venn.plot)
#调整参数进行图形优化
代码语言:javascript复制venn.plot <- draw.pairwise.venn( area1 = 80, #区域1的数
area2 = 30, #区域2的数
cross.area = 2, #重叠的个数
category = c("First", "Second"),#分类命名
fill = c("blue", "red"),#1 2 区域分别的填充颜色
lty = "blank", #1 2 区域的边框线类型
cex = 2, #1 2 区域内部数字的字体大小
cat.cex = 2, # 分类名称的字体大小
cat.dist = 0.09, #分类名称距离边的距离 实际调整
cat.just = list(c(-1, -1), c(1, 1)), #分类名称的位置 ,圈内或者圈外
ext.pos = 30, #线的角度 默认是正上方12点位置
ext.dist = -0.05, #外部线的距离 跟根据圆圈的大小适当调整
ext.length = 0.85, #外部线长度
ext.line.lwd = 2, #外部线的宽度
ext.line.lty = "dashed" ) #外部线为虚线);
grid.draw(venn.plot)
2.2 三个已知数据集的韦恩图
代码语言:javascript复制venn.plot <- draw.triple.venn(area1 = 80,area2 = 70,area3 = 50,n12 = 38,n23 = 18,n13 = 28,n123 = 8,category = c("First", "Second", "Third"),fill = c("blue", "red", "green"),lty = "blank",cex = 2,cat.cex = 2,cat.col = c("blue", "red", "green"))
grid.draw(venn.plot)
四 根据数据集合绘制韦恩图
4.1 四个数据集合
代码语言:javascript复制A <- sample(1:1000, 500, replace = FALSE);
B <- sample(1:1000, 600, replace = FALSE);
C <- sample(1:1000, 700, replace = FALSE);
D <- sample(1:1000, 800, replace = FALSE);
E <- sample(1:1000, 900, replace = FALSE);
venn.plot <- venn.diagram(#数据列表
x = list(A = A,B = B,C = C,D = D),
filename = "Venn_4set.tiff", #保存路径
col = "transparent", #指定图形的圆周边缘颜色 transparent 透明
fill = c("blue", "green", "yellow", "grey50"), #填充颜色
alpha = 0.50, #透明度
label.col = c("orange", "white", "grey50", "white","white", "white", "white", "white", "darkblue", "white","white", "white", "white", "darkgreen", "white"),
cex = 1.2, #每个区域label名称的大小
cat.col = c("darkblue", "darkgreen", "orange", "grey50"), #分类颜色
cat.cex = 1.2, #每个分类名称大小
cat.dist = 0.07,
cat.pos = 0, #
cat.fontfamily = "serif", #分类字体
rotation.degree = 270, #旋转角度
margin = 0.2 )
4.2 五个数据集合
代码语言:javascript复制venn.plot <- venn.diagram(
x = list( A = A, B = B, C = C, D = D, E = E ),
filename = "Venn_5set.tiff",
col = "black",
fill = c("dodgerblue", "goldenrod1", "darkorange1", "seagreen3", "orchid3"),
alpha = 0.50,
cat.col = c("darkblue", "darkgreen", "orange", "grey50","purple"),
cat.cex = 1.5,
cat.fontface = "bold",
margin = 0.05);
VennDiagram函数包最大能绘制5个数据集合的韦恩图,可以看到已经有点乱了,当更多集合的时候,可以使用之前分享的R|UpSet-集合可视化进行绘制。
韦恩图,走你。