tableau入门
tableau 产品体系
PC端:
tableau reader 阅读 免费
tableau public 免费 仅连接部分源,只能web公开发布(不能数据库,不能本地保存)
tableau desktop 所有连接,可保存本地,可发布到server (分个人版和专业版,专业版功能最全)
服务器版本:
tableau server 可在本地或云上部署,desktop编辑后可以上传到server,也可以直接在网页版编辑
tableau online Server的云托管版本,由tableau维护、升级
移动端:
tableau mobile 免费,必须搭配server使用,实际上就是连接到server
数据连接
读取文本,标准格式/非标准格式
读取csv,用文本文件,正常二维表均能正常读取,如果带注释符的使用数据解释器清理,如果数据解释器无法处理,只能先在原文档中手动处理好
pdf表格也能读取,字段需要注意手动修正
excel同理
数据透视表方式读取

长型是标准的统计数据格式,如果是宽型,需要转成长型,SQL,python(stack(),unstack())都可以转
tableau中也可以转,转换方式如下,选中需要转换的部分,右键数据透视表

宽表:
从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询性能的提高与便捷。这种宽表的设计广泛应用于数据挖掘模型训练前的数据准备。
窄表:
严格按照数据库设计三范式。尽量减少数据冗余,但是缺点是修改一个数据可能需要修改多张表。
数据库设计三大范式https://blog.csdn.net/dosthing/article/details/87954213
基本的数据整理操作

基本的数据显示设定

维度和度量

统计表的基本类型和绘制方法
表格的基本框架

几种基本表格类型:
1. 叠加表(Stacking)

2. 交叉表(Crosstabulation)

3. 嵌套表(Nesting)

4. 多层表(Layers)

5. 复合表格

表格绘制的基本步骤


单元格内指标的不同表达方式:可以实现不同的效果
浏览数据:可以在详细信息里设置不同的字段,点击浏览数据即可查看
统计图的分类框架

1. 单变量
1.1 单个分类变量

1.2 单个 数值变量

2. 多变量
2.1 数值因变量

2.2 分类因变量

2.3 其余更复杂的图形

注意:图形并非越复杂越好!!!

浙公网安备 33010602011771号