摘要: 使用岭回归根据多个因素预测医疗费用 主要步骤流程: 数据集链接:https://www.cnblogs.com/ojbtospark/p/16005626.html 1. 导入包 In [1]: # 导入包 import numpy as np import pandas as pd import 阅读全文
posted @ 2022-03-15 16:47 Theext 阅读(314) 评论(0) 推荐(0)
摘要: 使用多项式回归根据年龄预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 筛选数据 3.3 得到因变量 3.4 创建自变量 3.5 检验新的自变量和charges的相关性 3.6 拆分训练集和测试集 4. 构建多项式回归模型 4.1 构建模型 阅读全文
posted @ 2022-03-15 16:40 Theext 阅读(318) 评论(0) 推荐(0)
摘要: 使用多元线性回归根据多个因素预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 标签编码&独热编码 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 4. 构建多元线性回归模型 5. 得到模型表达式 6. 预测测试集 7. 得到模型MSE 阅读全文
posted @ 2022-03-15 16:34 Theext 阅读(433) 评论(0) 推荐(0)
摘要: 使用简单线性回归根据年龄预测医疗费用 主要步骤流程: 1. 导入包 2. 导入数据集 3. 数据预处理 3.1 检测缺失值 3.2 筛选数据 3.3 得到自变量和因变量 3.4 拆分训练集和测试集 4. 构建不同参数的简单线性回归模型 4.1 模型1:构建简单线性回归模型 4.1.1 构建简单线性回 阅读全文
posted @ 2022-03-15 16:29 Theext 阅读(339) 评论(0) 推荐(0)
摘要: 预处理黑色星期五数据(熟悉流程,后续文章有进行预测部分) 主要步骤流程: 1. 导入包和数据集 2. 处理缺失数据 3. 特征工程 4. 处理类别型字段 5. 得到自变量和因变量 6. 拆分训练集和测试集 7. 特征缩放 数据集链接:https://www.heywhale.com/mw/datas 阅读全文
posted @ 2022-03-15 16:28 Theext 阅读(119) 评论(0) 推荐(0)
摘要: 起因: 从上大学至今,对大数据日常接触,在校期间伴随着大数据这个名词也走过了三年,碰巧在今天看到了一篇文章(文章大致内容是描述某某高校的今年入学新生的数据,但是文章标题上的“大数据”三个字引起了我的注意,并有所感想),对于现在许多自媒体在写文章时硬是要冠上“大数据”这个词,对于就读数据科学与大数据技 阅读全文
posted @ 2022-03-10 19:40 Theext 阅读(137) 评论(0) 推荐(0)
摘要: 以应用 sk 为例子 一、安装好或下载好应用软件 查看 sk 所在位置 whereis sk 二、编写应用启动脚本.sh #!/bin/sh /usr/local/sk<<EOF bdfn33p2 EOF echo 'ok' 'bdfn33p2' 为启动应用时需要的参数,需要看具体应用 <<EOF 阅读全文
posted @ 2022-02-23 13:49 Theext 阅读(914) 评论(0) 推荐(0)
摘要: nps,npc其他版本见: https://github.com/ehang-io/nps/releases 官方文档:https://ehang-io.github.io/nps/#/install 基本使用:https://ehang-io.github.io/nps/#/use 一、服务端安装 阅读全文
posted @ 2022-02-23 13:29 Theext 阅读(1900) 评论(0) 推荐(0)
摘要: 星河长梦 二O二一九月廿七夜 星藏天上宫,河掠宙外域。 长望天涯边,梦中无似影。 阅读全文
posted @ 2021-09-27 22:32 Theext 阅读(93) 评论(0) 推荐(0)
摘要: 数据可视化图形库: python图形库:https://www.python-graph-gallery.com/ pyecharts图形库(极力推荐):https://pyecharts.org/#/zh-cn/tree_charts 阅读全文
posted @ 2021-09-17 23:03 Theext 阅读(54) 评论(0) 推荐(0)