在一篇论文中,最引人注目的除了标题和摘要,便是嵌于文中的各种图表了。而图形凭借其更为直观的表达效果一直备受学术界青睐,可以说如何用更为美观的图形更恰当、更全面、更精准地展现研究结果,是所有研究者一直在探索的课题。
一、R语言是什么
幸运的是,在R语言用于统计分析日益广泛的趋势下,利用它进行统计作图的强大优势解救了越来越多为数据可视化操碎了心的研究者。
R语言是用于数据处理、统计分析及绘图的计算机语言和操作环境,它是统计领域广泛使用的诞生于1980年左右的S语言的一个分支,可以认为是S语言的一种实现,由新西兰奥克兰大学的Robert Gentleman和Ross Ihaka及其他志愿人员开发开发;是属于GNU系统的一个自由、免费、源代码开放的软件。
二、为什么要用R语言作图
R语言强大而优秀的绘图功能是它从众多统计分析软件中脱颖而出的优势之一,除了依托于R语言本身用于统计分析的优势之外,R语言作图的强大主要还体现在以下方面:
1. R语言拥有较为全面的绘图系统,几乎可以覆盖科研领域中所有的研究场景和可视化需求;
2. 而这些绘图系统又各具特色,总能找到一款恰当精准地表达自己的统计分析结果,比如火山图尤其适用于阐明差异基因,Goplot适用于富集分析等等;
3. R语言可以实现诸多复杂统计图形的绘制,且图形美观大气,比如绘制下面几种复杂图形,是其它统计分析软件,比如Graghpad、SPSS难以实现的。R语言还支持多种图形输出,尤其是非常优秀的矢量图输出。
(课程部分截图)
三、R语言作图好学吗
好用是好用,但是R语言毕竟不是傻瓜式的操作软件,而是一种编程语言,由于担心难以掌握,很多研究者望而却步,错失了很多利用R语言帮助自己更高效完成统计分析、更精准全面实现数据可视化的机会。
然而事实是,R语言虽然功能复杂,学起来却并没有想象中那么难,它在编程语言中,是较简单易学、容易掌握的一种。虽然需要花费一定的时间和精力入门,但是当你搞懂了常用的数据类型、函数、循环与判断、包等几个概念之后,会发现其实R语言需要掌握的也就这些内容了。它不像java或者C/C ,学习道路异常的漫长,有太多的概念和框架需要学习。入了门之后,你会发现,其实需要学习的东西就那么一点,此后便走上应用R语言的康庄大道,任何一个R代码一看就懂,立马能用。
所以,不要因为一开始需要付出的那点时间精力,而错失走上统计分析可视化巅峰的机会。
而如果有前辈领路,入门的这个过程会更顺利一些。为了帮助大家更高效地学习和掌握R语言作图,我们特别邀请经验丰富的讲师,按照由浅入深的原则,针对生物医学领域应用最广泛的八大类图形制作了视频教程。
讲师简介
李老师,复旦大学生物信息学博士,擅长R语言绘图,编程,GEO、TCGA与Seer数据库,发表多篇SCI论文,拥有丰富的教学经验。
课程优势
1. 针对需求好实用:专门针对生物医学领域的科研需求,精心挑选八大类SCI论文中常见的图形,学会之后立即就可以应用在自己的文章里;
2. 图形高端上档次:本课程纳入的八大类图形基本都是只有通过R语言才能绘制的复杂图形,可以显著提升文章的档次。
3. 详细易学好上手:针对每类图形我们都提供好几种不同风格的图(比如GOplot我们有下面4个风格),每个都直接上实例,结合数据类型和代码手把手教学,并列出易错点。零基础新手也非常适用,完全不用担心运行出错不知道如何修改。
适合人群
1. 在读博士、硕士研究生及本科生;
2. 高校、科研机构的科研工作者;
3. 涉及到数据可视化的职场人士;
4. 任何需要进行统计制图的人员。
课程大纲
1. 数据挖掘标配谁,热图一出秒全场
2. 差异基因要说清,火山图出最明了
3. 单组多组要对比,箱式图一下全概括
4. 生存曲线玩的溜,预后判断好棒棒
5. 富集分析哪家强,GOplot来帮忙
6. KEGG气泡图,三个因素全知道
7. 基因分析看GSEA,整体层面能拔高
8. 蛋白互作PPI,不做实验发文章