精选100个Pandas函数
精心整理100个pandas常用函数,建议收藏~
a
代码语言:javascript复制aggregate() #聚合;基于内置函数或者自定义函数的聚合运算
argmin() 最小值所在的索引
argmax() 最大值所在的索引
any() 等价于逻辑“或”
all() 等价于逻辑“与”
astype() 强制类型转换
apply() # 自定义函数的元素操作
append() 序列元素的追加
assign() 字段衍生
b
代码语言:javascript复制bfill() # 后向填充;使用缺失值后一个填充缺失值
between() 区间判断
c
代码语言:javascript复制count() # 计数(不包含缺失值)
cov() 计算协方差
corr() # 计算相关系数
cumsum() 累计和
cumprod() 累计积
compress 条件判断
concat() # 数据合并
d
代码语言:javascript复制dtypes() 查看数据字段类型
describe() # 描述统计信息
duplicated() 判断是否有重复元素
drop_duplicates() #删除重复值
dropna() # 删除缺失值
diff() 一阶差分
dt.date() 提取日期
dt.time() 提取时间
dt.year() 提取年份
dt.month() 提取年份
dt.day() 提取天/日
dt.hour() 提取小时
dt.minute() 提取分
dt.second() 提取秒
dt.quarter() 提取季度
dt.weekday() # 提取星期几(返回数值,0,1,2.....)
dt.weeky_name() # 提取星期几(返回名称,Sunday,Friday等)
dt.week() 返回当年的第几周
dt.dayofyear() 返回年中的第几天
dt.daysinmonth() 月中最大的天数
dt.is_month_start() 是否为当月的第一天
dt.is_month_end() 是否为当月的最后裔天
dt.is_quarter_start() 是否为季度的第一天
dt.is_quarter_end() 是否为季度的最后一天
dt.is_year_start() 是否为当年的第一天
dt.is_year_end() 是否为当年的最后一天
dt.is_leap_year() # 判断是否为闰年
e
代码语言:javascript复制explode() # 爆炸函数
f
代码语言:javascript复制fillna() 填充缺失值
ffill() # 前向填充;使用前一个值填充缺失值
factorize() 因子化转换
g
代码语言:javascript复制groupby() # 分组
get_dummies() # 哑变量
h
代码语言:javascript复制hist() 绘制直方图
hasnans() 判断元素中是否存在缺失值;返回的是True或者False
i
代码语言:javascript复制isnull() # 判断序列元素是否为缺失值,返回bool值
isin() 成员判断
iloc() # 定位数据;只能使用数值
j
代码语言:javascript复制join() # 数据合并
k
代码语言:javascript复制kurt() 计算峰度
l
代码语言:javascript复制loc() # 定位数据
m
代码语言:javascript复制min() 最小值
max() 最大值
mean() 均值
median() 中位数
mode() 众数
map() # 元素映射
merge() # 合并数据
n
代码语言:javascript复制notnull() 非空判断
nsmallest() 最小的前n个值
nlargest() 最大的前n个值
p
代码语言:javascript复制pct_change 运算比率;后一个和前一个的比例
pd.to_datetime() 转日期时间类型
pd.Series() # 创建Series数据
pd.DataFrame() # 创建DataFrame数据
plot() 绘制基于Kind参数的多种图形;kind指定图形类型:饼图、柱状图、箱型图等
q
代码语言:javascript复制quantile() 分位数
r
代码语言:javascript复制replace() 替换值(不能使用正则)
str.replace() 值替换(可使用正则)
round() 四舍五入
read_csv() # 读取csv文件
read_excel() # 读取Excel文件
read_table() # 读取table文件
rank() # 排名
s
代码语言:javascript复制sum() 求和
size() 计数(包含所有数据,包含空值)
std() 计算标准差
skew() 计算偏度
sample() 抽样
str.split() 字符分割
str.findall()
sort_values() # 按值排序
sort_index() 按索引排序
stack() # 堆叠;列转行
t
代码语言:javascript复制to_dict() 转为字典
tolist() 转为列表
transpose .T # 转置
u
代码语言:javascript复制unique() 元素唯一值(去重)
unstack # 不要堆叠,多行转列
v
代码语言:javascript复制var() 计算方差
value_counts() # 统计每个元素的值
w
代码语言:javascript复制where() # 基于条件判断的值替换