2025.1.22(寒假第十五天)

分类模型基础
学习目标:
理解分类模型的基本原理和应用场景。
学习如何在 Spark MLlib 中使用逻辑斯蒂回归和决策树模型。
学习内容:
学习逻辑斯蒂回归和决策树的基本原理。
使用降维后的数据训练逻辑斯蒂回归模型。
对 Test 数据集进行预测,评估模型性能。

import org.apache.spark.ml.classification.LogisticRegression

// 准备训练数据
val Array(trainingData, testData) = pcaDF.randomSplit(Array(0.7, 0.3))

// 定义逻辑斯蒂回归模型
val lr = new LogisticRegression()
.setLabelCol("income")
.setFeaturesCol("pcaFeatures")

// 训练模型
val lrModel = lr.fit(trainingData)

// 预测
val predictions = lrModel.transform(testData)
predictions.show()
实验总结:
理解了分类模型的基本原理和应用场景。
掌握了如何使用逻辑斯蒂回归模型进行分类。
学会了如何对 Test 数据集进行预测。

posted @ 2025-01-22 09:24  kuku睡  阅读(7)  评论(0)    收藏  举报