摘要:
1.前言 博主研究生第一年已经成为过去式了,上了课,修了学分。接下来两年就是要搞搞学术了,方向为:大数据分析与数据挖掘。从此篇开始,就将学习过程中一些问题和想法与友交流之。这里是博主在学习中看的一本书《python数据分析与挖掘实战》中基础篇的一些代码规范以及参考方法,供大家学习。 2.错误分析 由 阅读全文
posted @ 2021-07-07 16:02
BabyGo000
阅读(586)
评论(0)
推荐(0)
摘要:
客户在餐厅点餐时,面对着菜单中大量的菜品信息,往往无法迅速的找到满意的菜品,既增加了点菜的时间,也降低了客户的就餐体验。实际上,菜品的合理搭配是有规律可循的:顾客的饮食习惯,菜品的荤素和口味,有些菜品之间是互相关联的,而有些菜品之间是对立或竞争关系(负关联)。这些规律都隐藏在大量的历史菜单数据中,如 阅读全文
posted @ 2021-07-07 16:01
BabyGo000
阅读(997)
评论(0)
推荐(0)
摘要:
航空公司客户价值分析 一、 背景与挖掘目标 客户关系管理是企业的核心问题,关键在于客户的分类:区别无价值客户,高价值客户,针对不同客户群体有的放矢投放具体服务方案,实现企业利润最大化的目标。 各大航空公司采取优惠措施喜迎更多客户,国内航司面对客户流失和资源未完全利用等危机,因此建立一个客户价值评估模 阅读全文
posted @ 2021-07-07 15:49
BabyGo000
阅读(899)
评论(0)
推荐(0)
摘要:
阅读提示 本文将进入数据挖掘与分析中较为困难的一部分———建模分析,将提到简单的分类预测实现方式,例如回归分析、决策树、人工神经网络等等。 目录 阅读提示 第五章 挖掘建模 一、分类与预测 1、实现过程 2、常见的分类与预测算法 3、回归分析 4、决策树 5、人工神经网络 6、Python分类预测模 阅读全文
posted @ 2021-07-07 15:47
BabyGo000
阅读(782)
评论(0)
推荐(0)
摘要:
阅读提示 本文将提到Python数据分析与挖掘中的 数据探索与数据特征分析 目录 阅读提示 一、数据探索 1、数据质量的分析 2、异常值的分析 3、一致性分析 二、数据特征分析 1、分步分析 2、对比分析 3、统计量分析 4、周期性分析 5、贡献度分析 6、相关性分析 一、数据探索 根据观测、调查收 阅读全文
posted @ 2021-07-07 15:44
BabyGo000
阅读(1393)
评论(1)
推荐(1)
摘要:
数据分析与可视化(一) 1.1 数据分析 1.1.1 数据、信息与数据分析 1.1.2数据分析与数据挖掘的区别 1.1.3数据分析的流程 1.2 数据可视化 1.3 数据分析与可视化常用工具 1.4 Python数据分析与可视化常用类库 1.1 数据分析 1.1.1 数据、信息与数据分析 数据 : 阅读全文
posted @ 2021-07-07 15:42
BabyGo000
阅读(386)
评论(0)
推荐(0)
摘要:
首先说明一下本人不是王一博粉丝,也不讨厌王一博,只是最近在学习python数据分析,就随便找了一条微博转发量来分析一下,只是刚好抽中了王一博哈~ 但是有些时候的确令人疑惑,为什么wyb随随便便发一条微博(不管是推广还是自拍)都可以有一百万加的转发量,这有点强哈~~~所以今天我们就选一条微博爬取其转发 阅读全文
posted @ 2021-07-07 15:41
BabyGo000
阅读(1245)
评论(0)
推荐(0)
摘要:
说明:本文章为Python数据处理学习日志,主要内容来自书本《利用Python进行数据分析》,Wes McKinney著,机械工业出版社。 电影数据分析 所需文件在Day2中下载,接下来要用到的一些文件的文件格式如下: users.dat文件格式 1::F::1::10::48067 2::M::5 阅读全文
posted @ 2021-07-07 15:40
BabyGo000
阅读(100)
评论(0)
推荐(0)
摘要:
文章目录 1、明确需求和目的 2、数据收集 3、数据预处理 3.1 数据整合 3.1.1 加载相关库和数据集 3.1.2 数据概览 3.2 数据清洗 3.2.1 缺失值处理 3.2.2 异常值处理 3.2.3 多余记录的删除 3.2.4 重复值的处理 4、数据分析 4.1 总体情况分析 4.2 各维 阅读全文
posted @ 2021-07-07 15:39
BabyGo000
阅读(629)
评论(0)
推荐(0)
摘要:
数学名词 离散化和面元划分 :就是分组,进行相应的计算 对于数据进行离散化和面元划分的前提条件是:连续变化的数据 例如下面是一组人的年龄数据,现在要按照年龄划分为不同年龄的4组(即把数据拆分为4个面元), 分别为“18到25”、“25到35”、“35到60”及“60以上。为了实现分组,需要使用pan 阅读全文
posted @ 2021-07-07 15:37
BabyGo000
阅读(576)
评论(0)
推荐(0)
浙公网安备 33010602011771号