职位画像分析(pandas/ matplotlib)
摘要:一、数据分析的步骤 二、提出问题 (1) 分析数据分析师主要的技能排名? (2) 分析数据分析师薪资和岗位地点、学历、工作年限的关系? (3) 数据分析师的学历需求? (4) 不同城市数据分析师的需求?(地图展示) 三、获取数据源 选择前程无忧官网 关键词:数据分析师 范围:全国 总记152页信息,
阅读全文
posted @
2019-11-28 21:38
foremost
阅读(2464)
推荐(0)
python 可视化工具-matplotlib
摘要:一、matplotlib介绍 python优秀的数据可视化第三方库 matplotlib库的效果 官网:https://matplotlib.org/ 当我们想画一个图但不知道怎么画出来的时候,就可以去这个网站上去找了,网站上罗列出来了各式各样的绘图形式 配置参数: axex: 设置坐标轴边界和表面
阅读全文
posted @
2019-11-25 19:18
foremost
阅读(825)
推荐(0)
pandas-缺失值处理
摘要:import pandas as pd import numpy as np Step 1.加载数据集 # header=0以第一行作为列名 tip = pd.read_csv("lianx.csv",sep=',',header=0) tip.head() Step 2.删除第 1,4,7,9,1
阅读全文
posted @
2019-11-24 21:06
foremost
阅读(466)
推荐(0)
k-means实战-RFM客户价值分群
摘要:数据挖掘的十大算法 基本概念 1、数据预处理:处理成 用户ID,R ,F,M四个字段 2、调用KMeans算法 进行聚类 ,设定为8类 3、对数据进行拟合,训练模型 ,每个ID对应一个类别(0-7) 4、如何将分类好的数字标签,和RFM 模型中的客户类别匹配起来? 查看每个类别的中心点,用其构造Da
阅读全文
posted @
2019-11-24 19:33
foremost
阅读(2674)
推荐(0)
药店商品销量分析(python)
摘要:一、数据分析的步骤 二、提出问题 分析药店商品销售情况 1)月均消费次数 2)月均消费金额 3)客单价 4)消费趋势 5)热销商品、滞销商品 三、理解数据 销售数据源为excel文件 字段的含义: 共有6579条销售数据 共有7个字段分别为:购买时间、社保卡号、商品编码、商品名称、销售数量、应收金额
阅读全文
posted @
2019-11-23 21:28
foremost
阅读(1431)
推荐(0)
Jike_Time
摘要:数据分析全景图 1. 数据采集。它是我们的原材料,也是最“接地气”的部分,因为任何分析都要有数据源。 2. 数据挖掘。它可以说是最“高大上”的部分,也是整个商业价值所在。之所以要进行数据分析,就是要找到其中的规律,来指导我们的业务。因此数据挖掘的核心是挖掘数据的商业价值,也就是我们所谈的商业智能 B
阅读全文
posted @
2019-11-05 10:43
foremost
阅读(217)
推荐(0)
Matplotlib-动画
摘要:Animation 动画 可以在python中直接显示动态图片 在命令行打开python然后输入代码,得到动态的函数曲线
阅读全文
posted @
2019-02-08 23:20
foremost
阅读(351)
推荐(0)
Matplotlib-多图合并显示
摘要:Subplot 多合一显示 Subplot 分格显示 matplotlib 的 subplot 还可以是分格的,这里介绍三种 图中图 次坐标轴 主次坐标轴
阅读全文
posted @
2019-02-08 23:07
foremost
阅读(4711)
推荐(0)
Matplotlib-画图种类
摘要:Scatter 散点图 本节我们将讲述各种不同的plot的方式。之前我们讲到了如何plot线,今天我们讲述如何plot散点图。 Bar 柱状图 生成基本图形 加颜色和数据 本节我们介绍一下用matplotib来制作一个柱状图, 生成基本图形 Contours 等高线图 contour美: ['kɑn
阅读全文
posted @
2019-02-08 21:33
foremost
阅读(1624)
推荐(0)
Matplotlib--基本使用
摘要:基础应用 figure 图像 设置坐标轴1 在 matplotlib 中如何设置坐标轴的范围, 单位长度, 替代文字等等. 调整名字和间隔 设置坐标轴2 这次会说到在我们如何移动matplotlib 中 axis 坐标轴的位置. Legend 图例 添加图例 调整位置和名称 Annotation 标
阅读全文
posted @
2019-02-08 16:59
foremost
阅读(1905)
推荐(0)
Pandas
摘要:Pandas基本介绍 像Excel一样使用python进行数据分析 Numpy 和 Pandas 有什么不同 如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用
阅读全文
posted @
2019-02-07 22:14
foremost
阅读(410)
推荐(0)
Numpy
摘要:Numpy 属性 ndim:维度 shape:行数和列数 size:元素个数 axis=0 与 axis=1 的区分 amin(a,0) 是延着 axis=0 轴的最小值,axis=0是把元素看成[1,2,3],[4,5,6],[7,8,9]三个元素,所以最小值是[1,2,3], amin(a,1)
阅读全文
posted @
2019-02-01 16:21
foremost
阅读(331)
推荐(0)
python 数据分析库介绍
摘要:1 引言 高效处理数据的python工具: 与外界进行交互: 读写各种文件格式和数据库 准备: 对数据进行清理、修整、整合、规范化、重塑、切片切换、变形等处理以便进行分析 转换: 对数据集做一些数学和统计运算以产生新的数据集。你如说,根据分组变量对一个大表进行聚合 建模和计算: 将数据进行统计模型、
阅读全文
posted @
2019-02-01 14:57
foremost
阅读(507)
推荐(0)