摘要: 目录 第1天: 数据清洗 第2天: 线性回归模型 第3天: 岭回归、Lasso回归、logistic回归模型、决策树、随机森林与K近邻模型 第4天: 贝叶斯模型,svm模型,k均值聚类,DBSCAN聚类,linux操作系统 第4天: liunx初步 第5天: liunx命令与xshell 周总结 一 阅读全文
posted @ 2021-10-26 22:41 wddwyw 阅读(31) 评论(0) 推荐(0) 编辑
摘要: 目录 第1天: 爬虫框架Scrapy和数据库MongoDB 第2天: 文档操作 第3天: 王者荣耀英雄皮肤爬取 第4天: 数据分析简介及模块 第5天: numpy模块 第6天: pandas模块 第7天: pandas模块与dataframe 第8天: pandas模块与matplotlib 第9天 阅读全文
posted @ 2021-10-19 22:41 wddwyw 阅读(28) 评论(0) 推荐(0) 编辑
摘要: 目录 第1天: 了解爬虫与HTML 第2天: HTML标签与正则表达式 第3天: re模块与requests模块 第4天: 破解反爬虫方法1 第5天: 数据加载方式与实例操作 第6天: 爬虫解析库之bs4模块 第7天: 数据爬取实例演练 第8天: openpyxl模块 第8天: 梨视频多页视频数据爬 阅读全文
posted @ 2021-10-07 21:33 wddwyw 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 目录 第1天: 数据库入门 第2天: 密码与基本SQL语句 第3天: 存储引擎与字段类型 第4天: 约束条件与表关系 第4天的配套作业: 表关系的判断 第5天: 单表查询 第5天的配套作业: 单表查询 第6天: 多表查询与Navicat 第7天: 多表查询练习与pymysql模块 第8天: pymy 阅读全文
posted @ 2021-09-01 16:25 wddwyw 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 目录 第1天: python的概念与环境配置 第2天: pycharm的安装与使用 第3天: 基本数据类型 第4天: 运算符与流程控制 第5天: for循环和数据类型内置方法 第6天: 文件操作的概念与字符编码 第7天: 文件操作方式 第8天: 函数 第9天: 模块 第10天:python的内置模块 阅读全文
posted @ 2021-08-31 16:11 wddwyw 阅读(28) 评论(0) 推荐(0) 编辑
摘要: Hadoop环境准备 虚拟机环境准备 克隆多台虚拟机 链接克隆 完整克隆 依次修改克隆出来的ip地址和主机名 ip地址修改 vim /etc/sysconfig/network-scripts/ifcfg-eth0 systemctl restart network host主机名 hostname 阅读全文
posted @ 2021-10-28 23:30 wddwyw 阅读(46) 评论(0) 推荐(0) 编辑
摘要: 异常情况 编辑过程中连接出现中断,再次链接编辑文件会提示相应信息 解决方式 删除显示的隐藏文件 rm -f .oldboy.txt.swp 出现的原因 编辑状态突然出现了中断 文件被多个人使用 总结 出现了隐藏文件,没有及时删除 vi -r oldboy.txt 目录结构说明 结构特点说明 linu 阅读全文
posted @ 2021-10-27 23:18 wddwyw 阅读(161) 评论(0) 推荐(0) 编辑
摘要: Linux操作系统的安装 安装centos7界面,可以输入命令修改网卡文件的名词 net.ifnames=0 biosdevname=0 # 写了网卡文件ifcfg-eth0 不写ifcfg-ens33 网络连接模式 虚拟网络编辑器说明 桥接模式 可以访问互联网 配置的地址信息和物理主机网段地址信息 阅读全文
posted @ 2021-10-26 22:40 wddwyw 阅读(243) 评论(0) 推荐(0) 编辑
摘要: 电脑的种类 台式机 笔记本 服务器 可以尽量避免数据不会丢失 可以24小时不间断提供服务 可以提升用户体验 PS:运维人员的工作,本质上就是为了上述三点的实现。 服务器的种类 云主机服务器 将多台硬件服务器进行整合,根据用户的需求分配硬件资源给相应客户 物理主机服务器 机架式服务器 刀片服务器 塔式 阅读全文
posted @ 2021-10-25 22:46 wddwyw 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 贝叶斯模型 高斯贝叶斯分类器 实例 分析数据 计算条件概率 计算结果 多项式贝叶斯分类器 实例 计算因变量各类频率和单变量条件概率 获得结果 伯努利贝叶斯分类器 实例 计算因变量各类频率和单变量条件概率 获得结论 高斯贝叶斯:皮肤识别 # 读⼊数据 skin = pd.read_excel(r'C: 阅读全文
posted @ 2021-10-25 22:45 wddwyw 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 1018(周一)内容概要 主体:pandas模块结束、matplotlib模块 pandas其他操作补充 pandas实战案例 可视化模块之matplotlib 周一内容详细 缺失值处理 缺失值的识别与处理 1. df.isnull 2. df.fillna 3. df.dropna data05 阅读全文
posted @ 2021-10-24 22:21 wddwyw 阅读(37) 评论(0) 推荐(0) 编辑
摘要: 模型的假设检验(F与T) F检验 提出原假设和备用假设,之后计算统计量与理论值,最后进行比较。 F校验主要检验的是模型是否合理。 导入第三方模块 import numpy as np import pandas as pd from sklearn import model_selection im 阅读全文
posted @ 2021-10-24 19:49 wddwyw 阅读(2767) 评论(0) 推荐(0) 编辑
摘要: 线性回归模型 什么是线性回归 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。 回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。 因变量与自变量 因变量 函数中的专业名词,也 阅读全文
posted @ 2021-10-21 21:38 wddwyw 阅读(118) 评论(0) 推荐(0) 编辑