最新 最热

Pandas数据变幻之向下填充

其实这个问题在excel中用if函数加vlookup函数分分钟搞定,但是人家说数据量大,excel处理不了,那只能python出马了,我想了一下,问题的关键是向下填充,每一个被查找点就是一个基准点,被查找点不改变时,基准点不变,可以参考excel中...

2020-06-17
1

为什么中位数(大多数时候)比平均值好

开始我的数据分析冒险之旅,我发现了解数据描述的主要统计方法是非常必要的。当我深入研究时,我意识到我很难理解为给定的数据选择哪个集中趋势指标有三种:平均值,中位数和众数。...

2020-06-01
1

[L3]快速掌握Series~通过Series索引获取指定值

由于在公众号上文本字数太长可能会影响阅读体验,因此过于长的文章,我会使用"[L1]"来进行分段。这系列将介绍Pandas模块中的Series,本文主要介绍:...

2020-05-13
1

数据清洗常用的 2 个小 trick

有特征上百个,根据多个特征筛选 DataFrame 时,如果这么做,可读性不太友好:

2020-05-09
1

python-pandas

# pandas 数据预处理 基于numpy# 读取csv文件(逗号隔开的文件)import pandas,os,numpy as nppath = r"D:desktopWorkspacePythonWorkSpaceMachine-Learningasstescsv2019_student_te......

2020-05-08
0

数据清洗常用的 2 个小 trick

有特征上百个,根据多个特征筛选 DataFrame 时,如果这么做,可读性不太友好:

2020-05-08
1

十分钟掌握Pandas基本操作(下)

对于Pandas的基本操作我们就总结到这里,这个数据集还可以用来做机器学习,把宝可梦的类型作为标签来预测,或是把是否是神兽作为标签来做二分类等等,我们下回见。...

2020-04-27
1

写在Pandas120题系列完结|附PDF版本源码下载

,为什么会有这个系列,其实内容主要是我在使用Pandas处理数据时遇到的各种问题与解决办法,本来想放在早起的Python工具箱系列中,结果一看记录的还挺多,就单独开一个专题吧。为什是120题,其实在一开始估计会总结200题...

2020-04-22
1

Pandas进阶修炼120题同步视频现已登陆

大家好,在周一我们更新了Pandas进阶修炼120题系列的完整版本,发布之后共有上百位读者获取了相关资料学习并,感谢各位的支持。但是也有一些读者发来了各种各样的报错,并且有很大一部分报错都是由于大家使用的Python与Panda...

2020-04-15
0

数据的探索性(EDA)分析

这里主要是对读取的数据有一个大致的了解,包括简单了解数据的行列信息,数据的统计特征等

2020-03-25
1