• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
可西可彻
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理

随笔分类 -  数据分析&数据挖掘

1 2 3 下一页

 
【数据分析&数据挖掘】非数值型数据的哑变量转化、连续型数据离散化——等宽分组&等频分组
摘要:1 import pandas as pd 2 import numpy as np 3 4 # 加载数据 5 detail = pd.read_excel("../day05/meal_order_detail.xlsx") 6 # print("detail :", detail) 7 prin 阅读全文
posted @ 2019-12-29 19:50 可西可彻 阅读(927) 评论(0) 推荐(1)
【数据分析&数据挖掘】相同数据结构互相填充
摘要:1 import pandas as pd 2 3 # 加载数据 4 data_1 = pd.read_excel("./填充数据.xlsx", sheetname=0) 5 data_2 = pd.read_excel("./填充数据.xlsx", sheetname=1) 6 7 print(" 阅读全文
posted @ 2019-12-29 19:48 可西可彻 阅读(175) 评论(0) 推荐(1)
【数据分析&数据挖掘】相关性计算+数据分析流程
摘要:1 import pandas as pd 2 3 detail = pd.read_excel("../day05/meal_order_detail.xlsx") 4 # print("detail: \n", detail) 5 print("detail的列名称: \n", detail.c 阅读全文
posted @ 2019-12-29 19:46 可西可彻 阅读(699) 评论(0) 推荐(1)
【数据分析&数据挖掘】缺失值的检测与处理——删除法、填充法&插值法
摘要:1 import pandas as pd 2 import numpy as np 3 4 # 加载数据 5 data = pd.read_excel("../day07/qs.xlsx") 6 # print("data: \n", data) 7 print("data的列索引: \n", d 阅读全文
posted @ 2019-12-29 19:44 可西可彻 阅读(1620) 评论(0) 推荐(1)
【数据分析&数据挖掘】数据合并和拼接案例
摘要:1 import pandas as pd 2 import numpy as np 3 4 # 加载数据——detail 5 detail_1 = pd.read_excel("./meal_order_detail.xlsx", sheetname=0) 6 detail_2 = pd.read 阅读全文
posted @ 2019-12-29 19:41 可西可彻 阅读(570) 评论(0) 推荐(1)
【数据分析&数据挖掘】拉格朗日插值法
摘要:1 from scipy.interpolate import lagrange 2 import pandas as pd 3 import numpy as np 4 5 # 加载数据 6 data = pd.read_excel("./qs.xlsx") 7 # print("data: \n 阅读全文
posted @ 2019-12-29 19:40 可西可彻 阅读(772) 评论(0) 推荐(1)
【数据分析&数据挖掘】异常值的判断与去除——3σ & 箱线图分析
摘要:1 import pandas as pd 2 3 # 异常值 ——远离正常值范围的错误值 4 # 异常值 ——删掉 5 6 # 异常值判断 ——3σ 箱线图分析 7 8 # 3σ 接住标准正态部分得到的规律——99.73%都在(μ-3α,μ+3α)之间,超过这个范围的数据认为是异常的 9 10 d 阅读全文
posted @ 2019-12-29 19:39 可西可彻 阅读(4669) 评论(0) 推荐(1)
【数据分析&数据挖掘】三种数据标准化方式——离差标准化、标准差标准化&小数定标标准化
摘要:1 import pandas as pd 2 import numpy as np 3 4 5 # 标准化 去除量级的影响 6 7 # 3种方式 8 # (1)离差标准化 9 # 将数据做线性变化,将数据映射到【0,1】范围内, 10 # x = (x - min) / (max - min) 1 阅读全文
posted @ 2019-12-29 19:37 可西可彻 阅读(5323) 评论(0) 推荐(2)
【数据分析&数据挖掘】连锁超市数据分析案例
摘要:1 import pandas as pd 2 3 # 加载数据 4 data = pd.read_csv("./order.csv", encoding="ansi") 5 # print("data: \n", data) 6 print("data的列索引: \n", data.columns 阅读全文
posted @ 2019-12-29 19:33 可西可彻 阅读(965) 评论(0) 推荐(1)
【数据分析&数据挖掘】计算每日营业额&最火菜品统计
摘要:1 import pandas as pd 2 import numpy as np 3 4 # 计算每日营业额 加载数据 5 detail = pd.read_excel("./meal_order_detail.xlsx") 6 print("detail: \n", detail) 7 pri 阅读全文
posted @ 2019-12-29 19:32 可西可彻 阅读(996) 评论(0) 推荐(1)
【数据分析&数据挖掘】pandas去空方法——删除法&保留法
摘要:1 import pandas as pd 2 3 # 加载数据 4 detail = pd.read_excel("./meal_order_detail.xlsx") 5 print("detail: \n", detail) 6 print("detail的列名称: \n", detail.c 阅读全文
posted @ 2019-12-29 19:30 可西可彻 阅读(994) 评论(0) 推荐(1)
【数据分析&数据挖掘】pandas分组聚合
摘要:1 import pandas as pd 2 import numpy as np 3 4 # 加载数据 5 detail = pd.read_excel("../day05/meal_order_detail.xlsx") 6 print("detail: \n", detail) 7 prin 阅读全文
posted @ 2019-12-29 19:29 可西可彻 阅读(325) 评论(0) 推荐(1)
【数据分析&数据挖掘】pandas交叉表&透视表
摘要:一、交叉表 1 import pandas as pd 2 import numpy as np 3 4 # 加载数据 5 detail = pd.read_excel("../day05/meal_order_detail.xlsx") 6 # print("detail: \n", detail 阅读全文
posted @ 2019-12-29 19:27 可西可彻 阅读(425) 评论(0) 推荐(1)
【数据分析&数据挖掘】pandas时间数据
摘要:1 import pandas as pd 2 """ 3 pandas默认支持的时间点类型——Timestamp 4 pandas默认支持的时间序列类型——DatetimeIndex 5 numpy默认支持的时间点数据类型——datetime64 6 """ 7 8 # 可以使用pd.to_dat 阅读全文
posted @ 2019-12-29 19:25 可西可彻 阅读(322) 评论(0) 推荐(1)
【数据分析&数据挖掘】pandas数据合并
摘要:1 import pandas as pd 2 3 # 加载数据 4 data_1 = pd.read_excel("./concat合并数据.xlsx", sheetname=0) 5 data_2 = pd.read_excel("./concat合并数据.xlsx", sheetname=1) 阅读全文
posted @ 2019-12-29 19:24 可西可彻 阅读(269) 评论(0) 推荐(1)
【数据分析&数据挖掘】numpy、pandas&matplotlib
摘要:1 import numpy as np 2 import pandas as pd 3 4 """ 5 numpy --科学计算库 6 核心 ndarray 7 本质: 存储单一数据类型的 内存连续的 N维数组 8 C F 风格存储 9 10 matplotlib 数据可视化的库 11 能绘制2- 阅读全文
posted @ 2019-12-29 19:22 可西可彻 阅读(191) 评论(0) 推荐(1)
【数据分析&数据挖掘】pandas的统计分析
摘要:1 # 在numpy 里面有统计分析, 对数值型数据进行统计指标 2 # np.max np.min np.mean np.std‘ 3 4 import pandas as pd 5 import numpy as np 6 7 # 1、加载数据 8 detail = pd.read_excel( 阅读全文
posted @ 2019-12-29 19:17 可西可彻 阅读(410) 评论(0) 推荐(1)
【数据分析&数据挖掘】pandas——文件的读取与保存
摘要:1 import pandas as pd 2 3 # 文本数据 人能够识别的有序的文件 4 # csv 文件 以逗号分隔的,文本文件 5 # pd.read_csv() 6 # filepath_or_buffer 文件路径 + 名称 7 # sep delimiter 都是分隔符 8 # hea 阅读全文
posted @ 2019-12-29 19:16 可西可彻 阅读(539) 评论(0) 推荐(1)
【数据分析&数据挖掘】dataframe的属性
摘要:1 import pandas as pd 2 3 # 创建一个df 4 df = pd.DataFrame( 5 data={ 6 "name": ["zs", "ls", "ww", "zl"], 7 "age": [18, 19, 29, 11], 8 "score": [92.5, 93, 阅读全文
posted @ 2019-12-29 19:14 可西可彻 阅读(408) 评论(0) 推荐(1)
【数据分析&数据挖掘】dataframe的增删改查
摘要:一、dataframe的增加操作 1 import pandas as pd 2 3 # 加载数据 4 users = pd.read_excel("./users.xlsx") 5 print("users:\n", users) 6 print("users 的类型:\n", type(user 阅读全文
posted @ 2019-12-29 19:09 可西可彻 阅读(528) 评论(0) 推荐(1)
 

1 2 3 下一页

公告


博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3