08 2018 档案

摘要:在《Python进行数据分析与挖掘实战》一书中,第10章 删除热水器不工作的数据(水流量为0并且开关机状态为“关”的数据。) 删除特定的列数据 阅读全文
posted @ 2018-08-16 15:52 平淡才是真~~ 阅读(24351) 评论(0) 推荐(0)
摘要:目录 4.1 数据清洗 4.1.1 缺失值处理 4.1.2 异常值处理 4.2 数据集成 4.2.1 实体识别 4.2.2 冗余属性识别 4.3 数据变换 4.3.1 简单函数变换 4.3.2 规范化 4.3.3 连续属性离散化 4.3.4 属性构造 4.3.5 小波变换 4.4 数据规约 4..4 阅读全文
posted @ 2018-08-06 18:10 平淡才是真~~ 阅读(1634) 评论(0) 推荐(0)
摘要:pandas使用浮点值NaN表示浮点和非浮点数组中的缺失数据。它只是一个便于被检测出来的标记而已: Python内置的None值也会被当做NA处理: NA处理方法 dropna 根据各标签的值中是否存在缺失数据对轴标签进行过滤,可通过阈值调节对缺失值的容忍度 fillna 用指定值或插值方法(如ff 阅读全文
posted @ 2018-08-06 18:09 平淡才是真~~ 阅读(608) 评论(0) 推荐(0)
摘要:项目背景: 2018年11月份开始学习数据分析相关课程,目前学到不少知识,准备开始找工作。在这之前想自己做一个实战,一是能够证明自己确实做了准备,初步具备数据分析师岗位的能力,二是通过实战复习自己所学知识,熟悉数据分析流程。三是,从自己想从事的数据分析职位入手分析,也能够借此了解数据分析师的收入情况 阅读全文
posted @ 2018-08-02 17:47 平淡才是真~~ 阅读(1668) 评论(1) 推荐(0)
摘要:7.1 背景与挖掘目标 客户分类,通过客户分类,区分无价值客户、高价值客户,将优先营销资源集中于高价值客户,实现企业利润最大化目标。 现在通过建立合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的营销策略,对不同的客户群提供个性化的客户服务是必须和有效的。(市场细分) 阅读全文
posted @ 2018-08-02 17:36 平淡才是真~~ 阅读(5388) 评论(0) 推荐(0)
摘要:1、什么是好的数据指标 衡量好坏的一些重要准则: (1)好的数据指标是比较性的。 如果能比较某数据指标在不同的时间段、用户群体、竞争产品之间的表现,就能更好的洞察产品的实际走向。 (2)好的数据指标是简单易懂的 如果人不能很容易记住或讨论指标,那么通过改变它来改变公司的作为很困难。 (3)好的数据指 阅读全文
posted @ 2018-08-01 18:00 平淡才是真~~ 阅读(486) 评论(0) 推荐(0)