利于Pandas和scikit-learn将str类型的data转换成int类型数值案例

假设一个data中其某列值是显示工作单位属性的,为了方便算法计算,需要将这些属性转换成数值替换。
通过pd.series.unique()确认工作单位属性的个数
利于pandas方法转换


使作anywhere即可返回到值的索引。

将需要str类型的所有列全部转换


实现批量替换

第二种,利于scikit-learn preprocess转换

也可以使用LabelEncoder,OneHotEncoder

OrdinalEncoder 与上面例题的pandas方法转换是一样的。将str值按其属性值的排序的索引值进行转换。
,OneHotEncoder, 略
LabelEncoder 是需要一列一列转换,也能实现数值转换。使用时需要加for循环
for col in salary.columns:
salary[col]=labelEncoder.fit_transfrom(salary[col])

posted @ 2020-10-12 11:13  hisweetyGirl  阅读(501)  评论(0编辑  收藏  举报