最新 最热

R语言作图——Radar chart

今天小仙同学给大家分享下Radar chart的作图方法,其实雷达图我们在生活中能经常可以见到,比如大家很喜欢玩的王者荣耀里就有。通过简单的图形对比,人物特点一目了然。...

2019-07-27
1

python 保存list数据

filename = open(‘a.txt’, ‘w’) for value in a: filename.write(str(value)) filename.close()

2019-06-25
1

Python小爬虫-读取豆瓣电影名称导出csv

# -*- coding: utf-8 -*-__author__ = 'YongCong Wu'# @Time : 2019/6/20 10:27# @Email : : 1922878025@qq.comfrom requests_html import HTMLSessionimport ...

2019-06-22
1

相关分析的简单示例

美国人口普查局(U.S. Census Bureau)的人口统计资料,该数据集包含了美国病人的医疗费用,在github中可以下载相应的数据。

2019-06-15
1

csv导入Hive脚本

from pyspark.sql import HiveContexthivec = HiveContext(sc) # 创建一个hivecontext对象用于写执行SQL,sc为sparkc

2019-05-26
1

基于Hadoop生态圈的数据仓库实践 —— 进阶技术(十二)

十二、间接数据源 本节讨论如何处理间接数据源。间接数据源与维度表具有不同的粒度,因此不能直接装载进数据仓库。在这里通过修改进阶技术(八)——“多路径和参差不齐的层次”里的促销源数据说明怎样处理间接数据...

2019-05-25
1

基于Hadoop生态圈的数据仓库实践 —— 进阶技术(八)

八、多路径和参差不齐的层次 本节讨论多路径层次,它是对单路径层次的扩展。上一节里数据仓库的月维度只有一条层次路径,即年-季度-月这条路径。在本节中加一个新的级别——促销期,并且加一个新的年-促销期-月的层...

2019-05-25
1

R-数据存读

读取文件之前,要了解自己在哪儿(getwd()),明了自己要去哪儿(setwd())我们下载一个文件操练一下(给大家点儿代入感)https://www.ncbi.nlm.nih.gov/geo/q

2019-05-23
1

词嵌入+神经网络进行邮件分类

数据集:https://www.kaggle.com/uciml/sms-spam-collection-dataset#spam.csv

2019-05-23
1

浅谈一款进阶软件R的实际运用

发现这款软件在小样本,常见的临床问题中可以快速的解决我们大部分问题,其简单操作界面以及菜单式操作方式成为很多人选择它的理由。但是,当我们遇到某些大数据,或者复杂统计运算时,如果还拿SPSS作为自己的救命稻草,那可能就...

2019-05-13
1