Pandas-31.通用方法-get_dummy

2019-05-30 15:01:01 浏览数 (2)

代码语言:javascript复制
`pandas.``get_dummies`(*data*, *prefix=None*, *prefix_sep='_'*, *dummy_na=False*, *columns=None*, *sparse=False*, *drop_first=False*, *dtype=None*)[[source]](http://github.com/pandas-dev/pandas/blob/v0.24.2/pandas/core/reshape/reshape.py#L701-L867)[](http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html#pandas.get_dummies "Permalink to this definition")

和factorize方法作用类似,但是会将拥有不同值的列转化为0/1的one-hot编码(Convert categorical variable into dummy/indicator variables). *用于少量值反复出现,而且离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码 离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

代码语言:javascript复制
>>> s = pd.Series(list('abca'))
>>> pd.get_dummies(s)
   a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0

0 人点赞