Tableau数据分析学习 --学习笔记

课程地址:https://study.163.com/course/courseMain.htm?courseId=1209019803&_trace_c_p_k2_=3a2f994d249c4702a7581ceceac0adc2

维度不可以计算,度量可以进行计算。


 

功能栏

tableau可以保存为两种格式,工作簿和打包工作簿(包含数据源)。

 菜单栏可以突出显示。

图表大小展示类型有四种,可以修改显示大小。

页面主要用于制作动态图表,在右边的选项可以显示动态变化

筛选器可以进行筛选,同时给用户进行筛选。

标记这一栏可以个性化图表,可以对于图表进行自定义颜色大小


 基本用法

数据拆分,在左侧数据栏选择需要拆分的字段,然后自定义拆分,选择分隔符,会进行拆分,可以在数据源里查看拆分。

组合,创建计算字段,连接符是+"连接符",等到计算有效按确定。

对于数据源进行整理,创建文件夹,然后拖拽需要的字段就可以了。

可以创建分层结构,按照次序拖入,方便进行上钻下钻,默认显示最大的,然后在行列上按加号就可以进行细分。

创建计算字段,可以通过公式以及拖拽字段进行创建字符。创建的计算字符可以前面的标签是不一样的。

创建组,在某个字段里面创建分组,更便于分析。可以使用查找,分组标签是回形针。包括其他同能,就会把其他未分组的成员放入其他组别下。

创建集,按照字段进行集排序,可以显示利润最高的TOP集客户排行。集只有内和外之分,会显示top10客户和集合外用户的统计情况。在编辑集里面,选择创建参数,可以创建最大值最小值以及步数,创建了之后在右边会有参数调节器,可以进行选择。

数据桶,将数据分为区间,按照区间做条形图和直方图,也就是组间距,可修改。

地理角色,左边地点字段可以选择属性,选择地理角色,国家,省,城市,标签会变成地球形状,双击会自动生成地图。可以进行下钻。

 


 

条形图:进行对比,比较差异;展示类别在不同地区的销售额情况,然后将利润拖至标记颜色里,通过颜色显示利润情况;图标内部,设置格式,修改背景色,修改字体颜色,修改网格线,设置轴格式,设置标题。

面积图:随着时间的变化,销售和利润的变化趋势。列,订单日期;行,销售额,利润。然后在年右键,使用个连续的月份绘制,再拖入类别,修改图类型使得三种类别在一张图上,然后在标记选择面积,生成了面积图。修改背景,字体,网格线。

散点图:销售额拉到列,总计利润拉到行,产品名称拉到详细信息,散点图可以看到每一个产品的利润情况,进行策略修改。

饼图: 展示占比情况,把类别拖到详细信息,饼图会根据类别进行占比颜色修改,需要显示的可以拖动到标签,这样可以直接在图上显示,销售额标记快速表计算显示百分比,

气泡图:通过气泡的大小和颜色来展示对比,可以展示两个维度的优劣对比。

文字云:将子类别拖动过道文字,销售额作为大小。

树状图:在智能显示里面选择,通过方块大小和颜色显示信息。。热图:

凸显表:表格形式 ,通过单元格之间颜色的情况,展示区别。


 

地图: 先将地点设置为地理角色格式,双击字段即可生成地图。ctrl拖动维度,然后设置完两个图,右键双轴可以将两个地图合并展示。地图-地图层,可以改变地图显示格式。可以自定义图案,放在我的tableua存储库,这样可以直接读取使用。

嵌套条形图,使用创建计算字段,if year(订单日期)= 2015 then 销售额 end , 使用双轴,同步轴,因此可以进行对比查看。左侧有两个图的格式选择。

子弹图: 突出预估和完成之间的差异情况,将需要作为参考线值的字段拖动到详细信息,左边分析标签页选择自定义参考线,选择每单元格,值选择预计销售额;也可以选择分布区间,选择百分之60,80,100平均值,选择填充颜色,显示更加明显。

瀑布图:反应数量的多少以及增减情况。利润拖到行,子类别拖到列,选择条形图,利润下拉选择快速表计算汇总,左侧选择甘特条形图,添加计算字段,-利润,将负利润拖动到大小。可以再拖动到颜色,通过颜色显示利润情况。

盒须图:展示数据的分布情况,又成箱形图,用来规避一些异常值。以华东地区分布广度最广以及中位数最高;西北地区数据宽度比较窄,数据较为集中。

环形图:环形图使用两个饼图进行双轴叠加,然后调整大小,就形成了环形图。去掉网格线之类的东西。快速表计算,总额百分比。

帕累托图:二八原则,字段可以隐藏,查看累计占比情况,不同分区的用户对于利润的贡献情况。利润拖动到行,客户ID拖动到列,整个视图显示。创建计算字段顾客数量累计占比,INDEX()/SIZE(),沿着客户id,然后使用占比替换列上的客户ID,将客户ID 拖动到详细信息,选择条形图,然后在详细信息客户ID排序,降序,按照字段,利润总和排序,设置标记类型为区域。

1.在行字段利润右键添加表计算,汇总,总和,按照客户ID特定维度,勾选添加辅助表计算,合计百分比,特定维度。拖动分析字段常量线,在图形上绘制0.2的客户占比,和0.8的利润占比,看占比是否满足二八原则。

2.在行按住CTRL拖拽利润,复制利润形成两个图形,继续上面的添加表计算,然后双轴,将区域改为线。

动态图:使用页面,将时间拖动进去,后面可以使用播放。


素材: tableau public 库

          公众号 数据分析且徐行

         图表库: https://www.iconfont.cn/

         数据: https:/data.world


常用函数

在创建计算字段有相应的函数以及示例。

if  else  end

case when  then   else  end 

 


 

表计算

index:返回分区中当前行的行数

size : 返回分区中的总行数

rank : 显示排名 rank(sum([销售额]))

running: 返回给定表达式从分区第一行到当前行的运行总计

window:窗口函数,有很多子函数,返回窗口内数据的聚合函数,不输入的话默认是从头到尾

total:返回总计

 

level of detail 详细级别表达式,数据的聚合度和颗粒度层次不同

fixed  :使用指定的维度进行聚合     {fixed  指定维度 : 聚合方式 }        优先级大于默认的分区效果


 

雷达图

表示五个指标之间的分布状况,制图原理和极坐标有点类似。

构建angel计算字段      running_sum(2*PI()/MIN({COUNTD([Indicator])})) +PI()/2                 {}是简写的 {FIXED: COUNTD([Indicate])} 计算有几个分析维度

 

 


 对比分析法:

对比为数据建立合理的参考值。

实际完成和目标值的对比,如子弹图

不同时期的对比

活动效果对比,活动前指标和活动后指标

不同地区、部门、主体的对比

行业内对比

 

条形图表示对比,嵌套条形图,子弹图,并排条形图

饼图也可以看出占比的对比

气泡图的颜色和大小也可以展示对比

 

突出值异常值分析:

常会出现缺失值和异常值。缺失值可以使用删除、或者利用均值众数中位数对缺失值进行补全。异常值、突出值,考虑突出原因,可以使用杜邦分析法拆解指标,考虑指标的贡献度,找到原因。

 

拐点、交叉点分析:

通常拐点和交叉点都代表着转折或者标志性事件。

方向性:向上还是向下

相对性:

周期性:

信号:

事件性:是否是有事物主导形成变化

复杂性:

 

放大缩小分析:

放大,找关键,自上而下,从整体到局部,找到影响整体的关键部分;如从商品的渠道、客户来源、客户类别、产品属性、销售过程、地理、时间属性等方面,进行细化分析。

缩小,看整体,从下往上,从局部回笼整体,是否是整体的变化影响了局部;如商品所在品类,行业竞品。

 

关联分析法:

啤酒喝尿不湿的关系

关联具有广泛性,方向性,种类单品间品类关联,度量

 

时间趋势分析

将销售分解为趋势、周期、时期、不稳定因素,综合着四方面的因素进行销售预测。


 

客户生命周期模型

 引入:新客获取

-成长:多品类多尝试

-成熟:忠诚客户

-休眠

-流失

根据两个维度定义客户的生命周期,这边使用消费时间跨度和最近一次下单时间,把客户简单的分为四个部分。

 

 制作方法:

  1.创建计算字段,首次购买时间Fd,末次购买时间Ld         使用fixed函数

  2. 创建计算字段,R=当前时间-Ld     由于数据源是历史数据,需要创建一个参考时间来替代参考时间,fixed:max,没有FIX就会变成度量而不是维度。

  3.创建计算字段,L=Ld-Fd

  4. 创建客户分类字段,将客户分为4个类别  

 5. 计算4个客户类别下的客户数量,countd([客户id])

 

如何确定参考值,观察客户第一次购买和第二次购买的时间间隔,根据28法则判定。


 RFM价值分析模型

 一种衡量客户价值和创利情况的模型。

根据三个角度对客户进行分析,Recent(最近交易时间),Frequency(频次),Money(金额) 区分客户类别,针对不同的分类进行客户运营策略。

 

 

 

 使用tableau制作RFM价值分析模型:

 

 


 

客户留存分析模型

一直持续活跃的用户叫做留存用户。

客户留存的三个阶段:

激活期:拉新阶段 

选择期:初次购买阶段,客户初步开始了解产品

平稳期:复购期 

 

流失分析多用于网站和APP的用户行为分析,需要通过埋点采集以及ABtest(确保分流逻辑完全随机)。

漏斗模型的重点在于决定 转化节点

转化节点不要超过5个,量级最好不好超过100倍

得到转化数据之后,也要对比同行业的数据转化情况。


 

帕累托图、二八法则

ABC分析法:把被分析的对象分为三类,0-20,20-50,50-100,A类就是最重要的百分之二十客户,创造了百分之八十的利润。

长尾理论:当成本急剧下降的时候,尾部客户贡献的利润也很高。

 

 

 

 


 仪表板的创建和实现

 可以通过平铺和浮动自定义面板效果

通过菜单栏-仪表板-操作-添加操作-筛选器,构建几个工作表之间的筛选联动,可以在鼠标进行选择的时候,控制目标工作表的筛选情况。也可以通过仪表板工作表的漏斗形状快捷创建筛选器,目标工作表是全体。

突出显示:同上,添加操作-突出显示,选择需要的表。

URL:可以在url链接中加入<字段>字段,修改url链接方便自动查询


仪表板的美化

图表布局(折线图需要平铺,气泡图尽量1:1展示)

容器边框,浮动设计

可以插入图片和文字

 


故事

增加分页

 

posted on 2020-03-05 13:53  椰汁黑糯米  阅读(1182)  评论(0)    收藏  举报

导航