随笔分类 -  数据挖掘

摘要:缺失值处理: 缺失值不是默认的nan而是特殊标记的: 数据离散化: 什么是: 为什么: 如何实现: 合并: 交叉表和透视表:(探索两个变量之间的关系) 分组和聚合: 综合案例: 阅读全文
posted @ 2021-02-16 12:08 喜欢爬的孩子 阅读(42) 评论(0) 推荐(0)
摘要:文件读取和存储: csv 读取: 写入; HDF5: json 阅读全文
posted @ 2021-02-10 10:42 喜欢爬的孩子 阅读(83) 评论(0) 推荐(0)
摘要:dataframe运算 算术运算; 逻辑运算: 逻辑运算函数: 统计运算: 统计函数: 累计统计: 自定义运算: pandas画图 阅读全文
posted @ 2021-02-09 01:10 喜欢爬的孩子 阅读(73) 评论(0) 推荐(0)
摘要:dataframe: multindex和panel 和series 索引操作: 赋值操作: 排序: 阅读全文
posted @ 2021-02-08 17:14 喜欢爬的孩子 阅读(72) 评论(0) 推荐(0)
摘要:合并: 水平拼接: 竖直拼接: 设置轴来设置是水平还是竖直拼接: 分割: io操作: numpy读取: 处理缺失值; 阅读全文
posted @ 2021-02-07 15:55 喜欢爬的孩子 阅读(57) 评论(0) 推荐(0)
摘要:类型修改: 数组去重: ndarray运算: 逻辑运算: 统计运算: 数组间运算: 数组与数的运算: 数组与数组的运算: 广播机制: 矩阵运算; 阅读全文
posted @ 2021-02-03 10:49 喜欢爬的孩子 阅读(71) 评论(0) 推荐(0)
摘要:基本操作: 生成数组的方法: 生成0和1的数组: 从现有数组生成: 生成固定范围的数组: 生成随机数组: 案例:随机生成八只股票交易两周的日涨幅数据 切片索引: 形状修改: 阅读全文
posted @ 2021-01-30 12:28 喜欢爬的孩子 阅读(59) 评论(0) 推荐(0)
摘要:numpy介绍: numpy: ndarray介绍: ndarray与Python原生list运算效率对比: ndarray优势: 存储风格: 并行化运算: 底层语言: ndarray属性 ndarray形状; ndarray类型; 阅读全文
posted @ 2021-01-29 11:03 喜欢爬的孩子 阅读(116) 评论(0) 推荐(0)
摘要:常见图形种类及其意义: 散点图; # 需求:探究房屋面积和房屋价格的关系 # 1、准备数据 x = [225.98, 247.07, 253.14, 457.85, 241.58, 301.01, 20.67, 288.64, 163.56, 120.06, 207.83, 342.75, 147. 阅读全文
posted @ 2021-01-28 09:13 喜欢爬的孩子 阅读(291) 评论(0) 推荐(0)
摘要:一般情况下启动jupyter notebook会默认是c盘。 那怎样打开D盘等文件呢: 具体操作如下:win + R 启动“运行”,输入cmd,在cmd窗口输入以下代码即可:· cd /d [路径]· jupyter notebook 操作图如下; 阅读全文
posted @ 2021-01-28 08:10 喜欢爬的孩子 阅读(408) 评论(0) 推荐(0)
摘要:运行如下代码; # 需求:画出某城市11点到12点1小时内每分钟的温度变化折线图,温度范围在15度~18度 import random import matplotlib.pyplot as plt # 1、准备数据 x y x = range(60) y_shanghai = [random.un 阅读全文
posted @ 2021-01-27 22:16 喜欢爬的孩子 阅读(966) 评论(0) 推荐(0)
摘要:matplotlib介绍: Matplotlib 是专门用于开发2D图表(包括3D图表)的python库 对应的JS库有 D3 (opens new window)echarts 官网:Matplotlib 为神魔要学习matplotlib: 实现一个简单的matplotlib画图: 我们可以将图丰 阅读全文
posted @ 2021-01-27 20:34 喜欢爬的孩子 阅读(138) 评论(0) 推荐(0)
摘要:运行一个案例如下: 如果使用pycharm就必须关掉图表之后才能显示数据 操作的相关注意事项: Cell操作: markdown演示: 阅读全文
posted @ 2021-01-26 20:56 喜欢爬的孩子 阅读(107) 评论(0) 推荐(0)