借助 scikit-learn 中的 LabelEncoder 类实现对数据集类标号的编码

示例:

1、简单创建一个数据集

import pandas as pd

df = pd.DataFrame([['乔峰', 'I', 95, '降龙十八掌', 'A'],
                   ['虚竹', 'II', 93, '天上六阳掌', 'B'],
                   ['段誉', 'II', 92, '六脉神剑', 'B'],
                   ['包不同', 'V', 65, '胡搅蛮缠', 'D'],
                   ['康敏', 'X', 10, '惑夫妒人', 'F']],
                   columns=['name', 'grade', 'score', 'skill', 'class'])
df

输出

 

 2 、对 df 的 class 数据进行编码

from sklearn.preprocessing import LabelEncoder

class_le = LabelEncoder()
y = class_le.fit_transform(df['class'].values)
y

输出

 

posted @ 2019-11-15 15:29  赏尔  阅读(372)  评论(0)    收藏  举报