03 2019 档案

摘要:本章内容源于慕课网的《机器学习入门-经典小案例》,需要安装graphlab(它比pandas速度快,可以直接从硬盘读取大文件,pandas只能从内存中读取,pandas不适合大文件)。 graphlab只能用于python2,由于我已经装过Anaconda3了,所以在Anaconda3的基础上搭建了 阅读全文
posted @ 2019-03-14 08:49 进击的小猴子 阅读(1163) 评论(0) 推荐(0)
摘要:一、背景和挖掘目标 二、分析方法与过程 1、数据获取 2、数据预处理 1.筛选有效问卷(根据表8-6的标准) 共发放1253份问卷,其中有效问卷数为930 2.属性规约 3.数据变换 3、模型构建 首先准备apriori.py,代码没看懂,不过可以直接调用 阅读全文
posted @ 2019-03-12 15:40 进击的小猴子 阅读(3204) 评论(0) 推荐(0)
摘要:一、背景和挖掘目标 二、分析方法与过程 客户价值识别最常用的是RFM模型(最近消费时间间隔Recency,消费频率Frequency,消费金额Monetary) 1、EDA(探索性数据分析) 2、数据预处理 1.数据清洗 票价为空表示该值缺失,票价为0表示飞这一趟没花钱,二者概念不同 2.属性规约 阅读全文
posted @ 2019-03-06 20:41 进击的小猴子 阅读(14878) 评论(1) 推荐(1)
摘要:一、背景与挖掘目标 相关背景自查 二、分析方法与过程 1、EDA(探索性数据分析) 1.分布分析 2.周期性分析 2、数据预处理 1.数据清洗 过滤非居民用电数据,过滤节假日用电数据(节假日用电量明显低于工作日) 2.缺失值处理 3.数据变换 以线损指标为例,可自定义为 通过这种方式,将上面各种复杂 阅读全文
posted @ 2019-03-01 11:43 进击的小猴子 阅读(4461) 评论(0) 推荐(0)