用 pandas 的 get_dummies 方法快速实现独热编码

将 get_dummies 方法应用于 DataFrame 数据是,它只对字符串列进行转换。

 

示例

1、创建一个示例数据集

import pandas as pd
data  = pd.DataFrame({'color':['blue', 'green', 'red'],'size': ['M', 'L', 'XL'],
                  'price': [34.5, 56.9, 23],'classlabel': ['I', 'II', 'I']},
                  columns=['color', 'size', 'price', 'classlabel'])

data

 

 

2、对 color 列进行编码

pd.get_dummies(data[['price', 'color']])

 

 

似乎来得比 scikit-leran 中的独热编码还要快一点。

posted @ 2019-11-15 19:02  赏尔  阅读(1675)  评论(0)    收藏  举报