tableau教程 快速入门

tableau教程 快速入门

先基础了解你的数据

  • 先选数据源
    • 了解你的数据源
    • 字段含义、字段类型
    • 数据更新频率、数据量、波动频率范围
      • 决定了你的时间颗粒度
      • 例子:
        • 页面转化率(约小时级别+日级别)
        • 财务营收收(日+周+月级别)
      • 细粒度只看最近的x小时/天/周
  • 想清楚你的需求、定义、dash 大概样子
  • 如果需要多表看,则join 数据, 了解下方的各种join 区别
    • 原理注意:MongoDB 经BI connector unwind后,把数据独立一个表
  • 架构介绍
    • tableau client/server <-> (cached)SQL data source (dremio) <-> BI connector <-> synced MongoDB(NoSQL) @China <-> MongoShake <-> MongoDB(Prod Secondary) @Foreign County
      • another : tableau client/server <-> (cached)SQL data source (dremio) <-> hive(hadoop) <-> DB Secondary <-> DB router / Syncer <-> DB (Prod Secondary)
    • web browser <-> (cached) tableau server <-> (cached)SQL data source (dremio)
    • 了解这个有助于找问题、debug

基础图形

柱状-group

  • string group
    2020-04-05-15-59-26

  • 0/1 sum /count中
    2020-04-05-15-59-45

  • bin 分箱 sum/count
    2020-04-05-16-00-01
    2020-04-05-16-00-56

  • time - series
    2020-04-05-16-01-18

  • multiple line
    2020-04-05-16-01-43

  • different calculate method: accumulate(累计)、 PCT change(波动)
    2020-04-05-16-02-18

A

advance part

Performance issue:

教学资源:

优化

  • tableau 可以做很多dash,所以很多时候各种dash 都可以做,甚至监控也可以
    • 所以很多时候 管理后台的各种dash 统计、图是不需要在code 了
    • 监控粒度为每小时
  • 查询优化
    • 查询中dremio缓存:
      • 转化后的sql 执行在dremio
        2020-04-05-16-05-28
    • 没cache
      • 转化后的sql 执行在dremio—> MongoDB
      • 转化后的sql 执行在dremio—> hive
        2020-04-05-16-05-56
posted @ 2020-04-05 16:08  邓维  阅读(6012)  评论(0编辑  收藏  举报