摘要: 需求:对数据进行分类问题的处理 开发步骤: 1 准备SparkSession的环境 2 准备大数据的数据 3 读取数据并进行解析 4 数据的基本信息的查看 5 特征工程 6 准备算法 7 模型训练 8 模型预测 9 模型校验 10 模型保存 11 新数据预测 代码模板: 阅读全文
posted @ 2020-03-02 17:47 我の女王 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 决策树的概念 ​ 决策树是一个类似于流程图的树结构:其中,每个内部结点表示一个特征或属性,而每个树叶结点代表一个分类。树的最顶层是根结点。使用决策树分类时就是将实例分配到叶节点的类中。该叶节点所属的类就是该节点的分类。(通过下图理解) 构建决策树三要素 特征选择 基于规则的选择 信息熵 一条信息的信 阅读全文
posted @ 2020-03-02 10:43 我の女王 阅读(710) 评论(0) 推荐(0) 编辑