代码语言:javascript复制
`pandas.``get_dummies`(*data*, *prefix=None*, *prefix_sep='_'*, *dummy_na=False*, *columns=None*, *sparse=False*, *drop_first=False*, *dtype=None*)[[source]](http://github.com/pandas-dev/pandas/blob/v0.24.2/pandas/core/reshape/reshape.py#L701-L867)[](http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html#pandas.get_dummies "Permalink to this definition")
和factorize方法作用类似,但是会将拥有不同值的列转化为0/1的one-hot编码(Convert categorical variable into dummy/indicator variables). *用于少量值反复出现,而且离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码 离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}
>>> s = pd.Series(list('abca'))
>>> pd.get_dummies(s)
a b c
0 1 0 0
1 0 1 0
2 0 0 1
3 1 0 0