最新 最热

数据清洗与管理之dplyr、tidyr

先前已经讲过R语言生成测试数据、数据预处理和外部数据输入等内容,但这仅仅是第一步,我们还需要对数据集进行筛选、缺失值处理等操作,以便获得可以应用于建模或者可视化的数据集(变量)。接下来就以鸢尾花测试数据集进行进...

2019-06-20
0

巧用R语言实现各种常用的数据输入与输出

将数据输入或加载到R工作空间中,是使用R进行数据分析的第一步。R语言支持读取众多格式的数据文件,excel文件,csv文件,txt文件和数据库(MYSQL数据库)等;其中,excel和csv是我们最常遇到的数据文件格式。...

2019-06-19
0

大数据告诉你:为啥近5年来Python如此火爆?

我们最近讨论过,那些被世界银行定义为高收入水平的发达国家,在选择使用什么类型的技术方面,和世界上的其他地方往往有着较大的区别。这类区别中,差异最大的例子之一,就是 Python 编程语言。如果只统计高收入国家的数据,这几...

2019-06-17
0

100篇泛癌研究文献解读之核受体基因家族探索

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视...

2019-06-15
0

100篇泛癌研究文献解读之使用EXPANDS和PyClone量化肿瘤内部异质性

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视...

2019-06-15
0

巧用R语言生成建模所需的测试数据

set.seed(n)主要是为了重复生成相同的随机数,特别用于重复性验证。只要在使用函数生成随机数之前设定set.seed(n),即可生成相同的随机数。

2019-06-14
1

R语言中如何写入xlsx的不同sheet表格

想要实现一个功能, 将不同的数据写入一个Excel中, 不同的数据对应不同的sheet表, 看了一下R语言, 找到的解决方法如下.

2019-06-13
0

几种加快R语言运算的方法

提升R代码运行速度并不需要很高级的优化技术, 例如代码并行化, 使用数据库, 使用c++等. 实际上, 通过简单的操作, 就能够是R的运算速度显著的加快, 下面介绍几种方法....

2019-06-13
0

基因组选择分析软件调研

目前, 基因组选择进入了一个高速发展的阶段, 各种新的算法和模型被提出。为了解相关软件应用的整体情况,也为选择合适的软件进行全基因组选择分析提供决策,这里对基因组选择的软件进行一个汇总。...

2019-06-13
0

如何批量安装R语言包

当你在新的环境下, 安装R语言时,你需要安装很多包,比如tidyverse,比如data.table,这里你可以写一个函数,将所有需要的包写进去,然后进行批量安装...

2019-06-13
0