摘要: 一、概述 1.1 在机器学习处理过程中,为了方便相关算法的实现,通常需要将标签数据(一般为字符串)转换成整数索引,或者在算法结束后将整数索引还原成相应标签。 1.2 在Spark ML包中提供了几个相关的转换器: StringIndex:将一列类别型的特征(或标签)进行编码,使其数值化,索引的范围从 阅读全文
posted @ 2021-01-30 10:45 Protect_Winter 阅读(318) 评论(0) 推荐(0)