2025.1.22(寒假第十五天)
分类模型基础
学习目标:
理解分类模型的基本原理和应用场景。
学习如何在 Spark MLlib 中使用逻辑斯蒂回归和决策树模型。
学习内容:
学习逻辑斯蒂回归和决策树的基本原理。
使用降维后的数据训练逻辑斯蒂回归模型。
对 Test 数据集进行预测,评估模型性能。
import org.apache.spark.ml.classification.LogisticRegression
// 准备训练数据
val Array(trainingData, testData) = pcaDF.randomSplit(Array(0.7, 0.3))
// 定义逻辑斯蒂回归模型
val lr = new LogisticRegression()
.setLabelCol("income")
.setFeaturesCol("pcaFeatures")
// 训练模型
val lrModel = lr.fit(trainingData)
// 预测
val predictions = lrModel.transform(testData)
predictions.show()
实验总结:
理解了分类模型的基本原理和应用场景。
掌握了如何使用逻辑斯蒂回归模型进行分类。
学会了如何对 Test 数据集进行预测。