摘要: 在spark ml pipeline的特征提取和转换阶段,有一种transformer可以将机器学习训练数据中常见的字符串列(例如表示各种分类)转换为数值索引列,以便于计算机处理。它就是StringIndexer。它支持的索引范围为[0, numLabels)(不支持的会编码为numLabels), 阅读全文
posted @ 2020-04-04 07:54 okay4321 阅读(194) 评论(0) 推荐(0) 编辑