Pandas之pd.get_dummies()
pd.get_dummies()的作用是将某个特征变量的多分类变成二分类.
import numpy as np
import pandas as pd
data = pd.DataFrame({"学号":[1001,1002,1003,1004],
"性别":["男","女","女","男"],
"学历":["本科","硕士","专科","本科"]})
data
output:
| 学号 | 性别 | 学历 |
|---|---|---|
| 0 | 1001 | 男 |
| 1 | 1002 | 女 |
| 2 | 1003 | 女 |
| 3 | 1004 | 男 |
使用pd.get_dummies()
pd.get_dummies(data)
output:
| 学号 | 性别_女 | 性别_男 | 学历_专科 | 学历_本科 | 学历_硕士 |
|---|---|---|---|---|---|
| 0 | 1001 | 0 | 1 | 0 | 1 |
| 1 | 1002 | 1 | 0 | 0 | 0 |
| 2 | 1003 | 1 | 0 | 1 | 0 |
| 3 | 1004 | 0 | 1 | 0 | 1 |
浙公网安备 33010602011771号