用 pandas 的 get_dummies 方法快速实现独热编码
将 get_dummies 方法应用于 DataFrame 数据是,它只对字符串列进行转换。
示例
1、创建一个示例数据集
import pandas as pd data = pd.DataFrame({'color':['blue', 'green', 'red'],'size': ['M', 'L', 'XL'], 'price': [34.5, 56.9, 23],'classlabel': ['I', 'II', 'I']}, columns=['color', 'size', 'price', 'classlabel']) data

2、对 color 列进行编码
pd.get_dummies(data[['price', 'color']])

似乎来得比 scikit-leran 中的独热编码还要快一点。
非学无以广才,非志无以成学。

浙公网安备 33010602011771号