tableau入门

tableau 产品体系

PC端:

tableau reader  阅读 免费 

tableau public 免费  仅连接部分源,只能web公开发布(不能数据库,不能本地保存)

tableau desktop  所有连接,可保存本地,可发布到server (分个人版和专业版,专业版功能最全)

服务器版本:

tableau server 可在本地或云上部署,desktop编辑后可以上传到server,也可以直接在网页版编辑

tableau online Server的云托管版本,由tableau维护、升级

移动端:

tableau mobile 免费,必须搭配server使用,实际上就是连接到server

 

数据连接

读取文本,标准格式/非标准格式

读取csv,用文本文件,正常二维表均能正常读取,如果带注释符的使用数据解释器清理,如果数据解释器无法处理,只能先在原文档中手动处理好

pdf表格也能读取,字段需要注意手动修正

excel同理

数据透视表方式读取

 

长型是标准的统计数据格式,如果是宽型,需要转成长型,SQL,python(stack(),unstack())都可以转

tableau中也可以转,转换方式如下,选中需要转换的部分,右键数据透视表

宽表:

从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询性能的提高与便捷。这种宽表的设计广泛应用于数据挖掘模型训练前的数据准备。

窄表:

严格按照数据库设计三范式。尽量减少数据冗余,但是缺点是修改一个数据可能需要修改多张表。

数据库设计三大范式https://blog.csdn.net/dosthing/article/details/87954213

 

基本的数据整理操作

 

 

 

基本的数据显示设定

 

维度和度量

 

 

统计表的基本类型和绘制方法

表格的基本框架

几种基本表格类型:

1. 叠加表(Stacking)

2. 交叉表(Crosstabulation)

 

 

 3. 嵌套表(Nesting)

 

 

 4. 多层表(Layers)

5. 复合表格

 

表格绘制的基本步骤

 

 

 

 单元格内指标的不同表达方式:可以实现不同的效果

浏览数据:可以在详细信息里设置不同的字段,点击浏览数据即可查看

 

统计图的分类框架

 

1. 单变量

 

 1.1 单个分类变量

1.2 单个 数值变量

 

2. 多变量

2.1 数值因变量

2.2 分类因变量

 

 2.3 其余更复杂的图形

 

注意:图形并非越复杂越好!!!

 

posted @ 2020-07-25 21:58  DDDdaisy  阅读(203)  评论(0)    收藏  举报