最新 最热

生物统计学与R极简手册

600字,约2分钟,思考问题的熊 专栏7----入门生物信息或者进行生命科学研究,所有人都绕不开统计知识和计算实现方式。针对生物统计学,Nature 杂志的专题中曾经有过如下评论:There is no disputing the importance of statist...

2018-06-07
0

Python和R正强强联合,“谁更好”的争论即将终结?

编译 | zzq出品 | 人工智能头条(公众号ID:AI_Thinker)【人工智能头条导读】如果你是数据分析领域的新兵,那么你一定很难抉择:在进行数据分析时,到底应该使用哪个语言,R 还是 Python?在网络上,也经常出现诸如“我想学习机器语言...

2018-06-05
0

用R处理不平衡的数据

在分类问题当中,数据不平衡是指样本中某一类的样本数远大于其他的类别样本数。相比于多分类问题,样本不平衡的问题在二分类问题中的出现频率更高。举例来说,在银行或者金融的数据中,绝大多数信用卡的状态是正常的,只有少数...

2018-06-04
0

好雨云帮一周问答集锦(2017.02.20-2017.02.26)

Q:我的主机上已经有公网IP了, 为何不能访问Web控制台?A:因为服务默认只监听内网网卡, 需要更改配置文件来监听公网IP编辑/etc/goodrain/docker-compose.yaml

2018-05-31
0

将R与Cloudera Impala集成,以实现Hadoop上的实时查询

Cloudera Impala支持Hadoop数据集上的低延迟交互式查询,这些数据集可以存储在Hadoop分布式文件系统(HDFS)或Hadoop的分布式NoSQL数据库HBase中。Impala的想法是使用Hadoop作为存储引擎,但远离MapReduce算法。相反,Impala使...

2018-05-29
0

R 语言线性回归应用:拟合 iOS 录音波形图

引言微信读书有一个录音功能需求: 录音时绘制音频波形, 音频以 wav 格式保存 再次进入界面,加载 wav,重新渲染音频波形 步骤 1 通过 NSRecorder.averagePow...

2018-05-28
0

(数据科学学习手札37)ggplot2基本绘图语法介绍

ggplot2是R语言中四大著名绘图框架之一,且因为其极高的参数设置自由度和图像的美学感,即使其绘图速度不是很快,但丝毫不影响其成为R中最受欢迎的绘图框架;ggplot2的作者是现任Rstudio首席科学家的Hadley Wickham,ggplot2基...

2018-05-26
0

想用R和Python做文本挖掘又不知如何下手?方法来了!

大数据文摘作品,转载要求见文末 作者 | Karlijn Willems 编译团队 | 饶蓁蓁,Mirra,apple黄卓君 文本挖掘应用领域无比广泛,可以与电影台本、歌词、聊天记录等产生奇妙的化学反应,电影对白、歌词和聊天记录等文本...

2018-05-25
0

麻省理工三位教授教你一步步创建自己的R程序包(附完整教程下载)

大数据文摘作品,转载要求见文末原作者 | PakinJa编译 | 笪洁琼,张天健,AileenR语言是很多数据科学家和科研人员会用到的语言,根据自己的需要开发独立的R程序包可以使自己的工作更快捷方便,也便于与他人分享。本文摘自由三...

2018-05-25
0

脑洞 | 哈佛教授公开R语言源码,教你用R制作gif动图

本文授权转自数据派(datapi)原文标题:Code for my educational gifs作者:Rafael Irizarry翻译:贾琳 编辑:黄继彦Rafael Irizarry是哈佛大学以及the Dana-Farber Cancer Institute的应用统计教授,他专注于研究基因组学......

2018-05-24
0