摘要:
使用DBSCAN对环形数据做聚类 主要步骤流程: 1. 导入包 2. 生成数据并可视化 3. 使用DBSCAN做聚类并可视化 3.1 参数组合1 3.2 参数组合2 3.3 参数组合3 3.4 参数组合4 4. 使用K-Means做聚类并可视化 5. 打印调整兰德指数 1. 导入包 In [2]: 阅读全文
posted @ 2022-03-15 18:50
Theext
阅读(557)
评论(0)
推荐(0)
摘要:
使用轮廓系数评估超市客户分组效果 主要步骤流程: 1. 导入包 2. 导入数据集 3. 使用K-Means算法得到不同K值对应的WCSS4. 使用K-Means算法得到不同K值对应的轮廓系数 3.1 生成WCSS 3.2. 画出 K值 vs WCSS 图 4. 使用K-Means算法得到不同K值对应 阅读全文
posted @ 2022-03-15 18:41
Theext
阅读(981)
评论(0)
推荐(0)
摘要:
使用K-Means对超市客户分组 主要步骤流程: 1. 导入包 2. 导入数据集 3. 使用肘部法则选择最优的K值 4. 使用K=5做聚类 5. 可视化聚类效果 6. 采取措施 7. 瑞士卷生产及其聚类 数据集链接:https://www.heywhale.com/mw/dataset/623069 阅读全文
posted @ 2022-03-15 18:34
Theext
阅读(461)
评论(0)
推荐(0)
摘要:
使用支持向量机预测黑色星期五花销 主要步骤流程: 数据集链接:https://www.cnblogs.com/ojbtospark/p/16005660.html 1. 导入包 In [ ]: # 导入包 import numpy as np import pandas as pd 2. 导入数据集 阅读全文
posted @ 2022-03-15 18:22
Theext
阅读(230)
评论(0)
推荐(0)
摘要:
使用AdaBoost预测黑色星期五花销 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测并处理缺失值 3.2 删除无用的列 3.3 检查类别型变量 3.4 标签编码&独热编码 3.5 得到自变量和因变量 3.6 拆分训练集和测试集 3.7 特征缩放 4. 使用不同的参数 阅读全文
posted @ 2022-03-15 18:06
Theext
阅读(653)
评论(0)
推荐(0)
摘要:
使用随机森林预测德国人信贷风险 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测并处理缺失值 3.2 处理类别型变量 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建随机森林模型 4.1 模型1:构建随机森林模型 4.1 阅读全文
posted @ 2022-03-15 17:33
Theext
阅读(379)
评论(0)
推荐(0)
摘要:
使用决策树预测德国人信贷风险 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测并处理缺失值 3.2 处理类别型变量 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建决策树模型 4.1 模型1:构建决策树模型 4.1.1 阅读全文
posted @ 2022-03-15 17:14
Theext
阅读(284)
评论(0)
推荐(0)
摘要:
基于逻辑回归预测客户是否购买汽车新车型ROC曲线 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理4. 构建逻辑回归模型 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4.构建逻辑回归模型 5. 手工画 阅读全文
posted @ 2022-03-15 17:08
Theext
阅读(281)
评论(0)
推荐(0)
摘要:
基于逻辑回归预测客户是否购买汽车新车型 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建逻辑回归模型 4.1 模型1:构建逻辑回归 阅读全文
posted @ 2022-03-15 17:06
Theext
阅读(261)
评论(0)
推荐(0)
摘要:
基于朴素贝叶斯预测客户是否购买汽车新车型 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4. 构建朴素贝叶斯模型做预测 4.1 构建模型并训练 4.2 阅读全文
posted @ 2022-03-15 17:01
Theext
阅读(191)
评论(0)
推荐(0)
摘要:
基于KNN预测客户是否购买汽车新车型 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 生成自变量和因变量 3.3 查看样本是否均衡 3.4 将数据拆分成训练集和测试集 3.5 特征缩放 4. 使用不同的参数构建KNN模型 4.1 模型1:构建KNN模型并 阅读全文
posted @ 2022-03-15 16:58
Theext
阅读(574)
评论(0)
推荐(0)
摘要:
使用LASSO回归根据多个因素预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 标签编码&独热编码 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 3.5 特征缩放 4. 构建不同参数的LASSO回归模型 4.1 模型1:构建LASS 阅读全文
posted @ 2022-03-15 16:54
Theext
阅读(827)
评论(0)
推荐(0)
摘要:
使用岭回归根据多个因素预测医疗费用 主要步骤流程: 数据集链接:https://www.cnblogs.com/ojbtospark/p/16005626.html 1. 导入包 In [1]: # 导入包 import numpy as np import pandas as pd import 阅读全文
posted @ 2022-03-15 16:47
Theext
阅读(314)
评论(0)
推荐(0)
摘要:
使用多项式回归根据年龄预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 筛选数据 3.3 得到因变量 3.4 创建自变量 3.5 检验新的自变量和charges的相关性 3.6 拆分训练集和测试集 4. 构建多项式回归模型 4.1 构建模型 阅读全文
posted @ 2022-03-15 16:40
Theext
阅读(318)
评论(0)
推荐(0)
摘要:
使用多元线性回归根据多个因素预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 标签编码&独热编码 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 4. 构建多元线性回归模型 5. 得到模型表达式 6. 预测测试集 7. 得到模型MSE 阅读全文
posted @ 2022-03-15 16:34
Theext
阅读(433)
评论(0)
推荐(0)
摘要:
使用简单线性回归根据年龄预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 筛选数据 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 4. 构建不同参数的简单线性回归模型 4.1 模型1:构建简单线性回归模型 4.1.1 构建简单线性回 阅读全文
posted @ 2022-03-15 16:29
Theext
阅读(339)
评论(0)
推荐(0)
摘要:
预处理黑色星期五数据(熟悉流程,后续文章有进行预测部分) 主要步骤流程: 1. 导入包和数据集 2. 处理缺失数据 3. 特征工程 4. 处理类别型字段 5. 得到自变量和因变量 6. 拆分训练集和测试集 7. 特征缩放 数据集链接:https://www.heywhale.com/mw/datas 阅读全文
posted @ 2022-03-15 16:28
Theext
阅读(119)
评论(0)
推荐(0)