Tableau-桌面认证助理备考指南-全-

Tableau 桌面认证助理备考指南(全)

原文:zh.annas-archive.org/md5/89fb58cd0c7fd6dd4328c3d8d716c787

译者:飞龙

协议:CC BY-NC-SA 4.0

前言

毫无疑问,数据是组织的关键资产,正确处理数据以充分利用它非常重要。Tableau 是目前市场上最好的技术之一,它允许我们处理数据,实时切割它,并进行复杂的数据分析。然而,它要求你理解数据分析的关键概念以及如何驱动 Tableau 以提供价值。此外,由于我们处于竞争环境中,我们应该不断改进我们的技能,学习新技术、新功能和新的数据分析方法,以保持领先地位。

这本书的目标是帮助你为 Tableau Desktop 认证相关联考试做准备。这本书是由通过这项考试的人编写的,他们将分享他们的经验和资源,以便你也能成功通过考试。

那么,为什么获得 Tableau 认证很重要呢?嗯,这个认证不仅评估我们对 Tableau 的知识,还评估我们使用强大的可视化技术舒适地处理数据和与人沟通的能力。此外,它还要求我们理解整体商业智能BI)解决方案及其在组织中的作用。

Tableau 的理念在于使数据访问民主化。换句话说,业务用户将使用 Tableau 的功能来切割和分解数据;连接各种系统、数据库和文件;可视化数据;构建仪表板;并探索数据。

作为一名专业的 Tableau 开发者,你应该知道如何连接数据、探索它以及切割和分解它。通常,你将不得不构建仪表板或用数据讲故事。了解数据可视化的最佳实践以使你的工作有效是很好的。在某些情况下,你应该计算新的指标,并利用 Tableau 的表格计算或详细程度计算。有时,参数可以帮助你过滤数据并添加自助功能。最后,你应该对统计学有所了解,并知道如何使用内置功能进行预测、趋势线和聚类。你应该了解 Tableau Server 以及如何分享和发布你的工作。这本书将帮助你涵盖所有这些领域,不仅为考试做准备,还能帮助你提高数据分析的整体技能。

这本书将帮助你为桌面专家和桌面认证相关联认证做准备。此外,它还将为你提供桌面专业的基础知识。根据我的经验,桌面专家并不像桌面相关联那样有价值。

在深入 Tableau 课程之前,让我们回顾一下作者的成功故事,并从他们自己的话中了解更多关于他们的 Tableau 之旅。

Dmitry Anoshin,Tableau Desktop 和 Server 合格认证:

"我从 2011 年开始使用 Tableau。大多数时间,我都在从事数据仓库项目,并使用 Tableau 作为主要的 BI 工具。我没有花太多时间在出色的可视化上和复杂的计算上。此外,我还负责 Tableau Server 的部署和支持。我的雇主从未要求我完成 Tableau 认证。最近,我参与了 Tableau 社区和用户组,并决定通过考试来填补我的知识空白。经过一些准备,我成功通过了 Tableau Desktop 合格认证和 Tableau Server 合格认证。这并不容易,也花了很多额外的努力。但这一切都是值得的。现在,我对我的技能更有信心,可以向我的同事和雇主展示我的知识。"

Gleb Makarenko,Tableau Desktop 合格认证协会认证:

"我从 2018 年开始使用 Tableau,很快就爱上了软件的直观性和易用性。我能够轻松适应其界面并创建强大的可视化。我决定在 Tableau 软件上获得认证,以获得可以在简历上使用的正式资格,以及学习我当时没有使用的细节。通过一些努力和调查,我完成了考试,并会向任何认真想要与 Tableau 合作的人推荐这样做。"

JC Gillet,Tableau Desktop 合格认证协会认证:

"我从 2014 年开始使用 Tableau。在我职业生涯的前几年,我主要使用 Tableau 的地图功能,因为我发现这是一种非常有效传达洞察力的方式。2018 年,我开始几乎完全使用它,因为它是我们新团队的 BI 工具。一旦你克服了它的几个小瑕疵,它就是一个真正强大且易于使用的平台。当我发现自己成为 Tableau 的本地专家时,参加认证考试对我来说似乎是自然而然的一步。现在,我拥有一个广为人知的资格,我可以用它来向我的现任和未来雇主展示自己。甚至在参加考试的过程中,我还学到了一些东西!"

Fabian Peri,Tableau Desktop 合格认证协会认证:

"我是在 2015 年作为研究生第一次接触 Tableau 的。我的教授推荐我使用 Tableau 来完成一个数据可视化作业。使用了几天后,我明白了它如何帮助我的公司利益相关者从大量数据中获得洞察力。从那时起,Tableau 就成了我首选的可视化工具。尽管我已经使用 Tableau 多年,但我对参加 Tableau 认证考试犹豫不决,因为我不知道它是否有任何用处。在我的最后一次求职中,我意识到 Tableau 认证将使我与其他候选人区别开来。在阅读了大量的资料后,我通过了认证考试——整个过程是一次极好的学习经历。此外,它也增强了我作为 Tableau 开发者的技能信心。"

拉迪卡·比扬尼,Tableau Desktop 认证助理:

“我在 2016 年作为研究生在完成数据可视化作业时第一次接触到 Tableau。我深深地爱上了它,从那时起,它就成了我首选的可视化工具。当我开始以分析顾问的身份每天为我的客户使用它时,我知道获得 Tableau 认证将帮助我轻松赢得任何新客户或潜在客户的信任。我在 2017 年获得了认证,为认证而学习帮助我学习了某些我并不熟悉的工具细微差别,尽管我每天都在使用 Tableau。这些使我的工作更快、更高效、更好,并且我至今仍在工作中使用这些技能。我完全推荐 Tableau 考试给任何想将他们的技能提升到下一个水平的人!”

既然我们已经了解了认证的一般内容,并且学习了为什么准备并通过 Tableau 考试很重要,现在是时候了解 Tableau 的关键主题,这将帮助你成功准备 Tableau Desktop 认证助理考试,并在不到 2 小时内以超过 75%的分数通过考试。祝你好运!

本书面向对象

本书面向希望获得 Tableau Desktop 助理认证的商业分析师、BI 专业人士和数据分析师,他们想使用这个内容丰富的指南解决一系列数据科学和 BI 问题。每一章都包含自我评估问题,以便你能够熟悉 Tableau Desktop 的提供内容。预期你有一些 Tableau Desktop 的先前经验。

本书涵盖内容

第一章,构建你的数据模型,将帮助你理解如何连接到你的数据并使用 Tableau 的数据建模功能。

第二章,使用工作表,将向你展示如何使用你准备好的数据开始构建你的可视化,以便分享见解。本章将演示如何使用 Tableau 的工作表进行你的分析。

第三章,使用图表分析数据,教你关于 Tableau 中可用的各种图表类型。本章还将讨论格式化如何帮助创建更有效的可视化。

第四章,可视化地理数据,深入探讨了地图可视化,并使你能够更深入地了解 Tableau 的地图功能。本章将解释如何创建、导航和自定义地图。

第五章,理解 Tableau 中的简单计算,帮助你创建可以在前几章中读到的各种可视化中利用的简单计算。

第六章,Tableau 表计算,探讨了更高级的表计算,本章观察到的计算结果将被用于构建进一步的计算。

第七章,详细程度表达式,涵盖了 Tableau 中可用的三种详细程度表达式类型,并解释了如何使用它们在比指定维度更细粒度或更粗粒度的级别上聚合数据。

第八章,利用分析功能,涵盖了 Tableau 的一些分析工具,使您能够创建参考线或带,将数据聚类在相似的桶中,识别趋势,并预测您的数据在未来的样子。

第九章,构建您的仪表板,将向您介绍功能和最佳实践,帮助您构建可操作和富有信息量的仪表板。

要从这本书中获得最大收益

没有任何 Tableau 先验知识的读者可以从这本书中获得最大收益。

下载示例代码文件

您可以从www.packt.com的账户下载本书的示例代码文件。如果您在其他地方购买了这本书,您可以访问www.packtpub.com/support并注册,以便将文件直接通过电子邮件发送给您。

您可以通过以下步骤下载代码文件:

  1. www.packt.com登录或注册。

  2. 选择支持选项卡。

  3. 点击代码下载。

  4. 在搜索框中输入书名,并遵循屏幕上的说明。

一旦文件下载完成,请确保您使用最新版本的软件解压缩或提取文件夹:

  • Windows 上的 WinRAR/7-Zip

  • Mac 上的 Zipeg/iZip/UnRarX

  • Linux 上的 7-Zip/PeaZip

本书代码包也托管在 GitHub 上,地址为github.com/PacktPublishing/Tableau-Desktop-Certified-Associate-Exam-Guide。如果代码有更新,它将在现有的 GitHub 仓库中更新。

我们还有其他来自我们丰富的图书和视频目录的代码包可供选择,地址为github.com/PacktPublishing/。查看它们吧!

下载彩色图像

我们还提供了一份包含本书中使用的截图/图表彩色图像的 PDF 文件。您可以从这里下载:www.packtpub.com/sites/default/files/downloads/9781838984137_ColorImages.pdf

使用的约定

本书使用了多种文本约定。

CodeInText: 表示文本中的代码单词、数据库表名、文件夹名、文件名、文件扩展名、路径名、虚拟 URL、用户输入和 Twitter 昵称。例如:“将下载的WebStorm-10*.dmg磁盘映像文件作为系统中的另一个磁盘挂载。”

粗体: 表示新术语、重要单词或屏幕上看到的单词。例如,菜单或对话框中的单词在文本中会这样显示。例如:“从管理面板中选择系统信息。”

警告或重要提示会这样显示。

小贴士和技巧会这样显示。

联系我们

欢迎读者反馈。

一般反馈: 如果您对本书的任何方面有疑问,请在邮件主题中提及书名,并将邮件发送至customercare@packtpub.com

勘误: 尽管我们已经尽最大努力确保内容的准确性,但错误仍然可能发生。如果您在这本书中发现了错误,我们将非常感激您能向我们报告。请访问www.packtpub.com/support/errata,选择您的书籍,点击勘误提交表单链接,并输入详细信息。

盗版: 如果您在互联网上发现我们作品的任何非法副本,我们将非常感激您能提供位置地址或网站名称。请通过copyright@packt.com与我们联系,并提供材料的链接。

如果您有兴趣成为作者: 如果您在某个领域有专业知识,并且您有兴趣撰写或为书籍做出贡献,请访问authors.packtpub.com

评论

请留下评论。一旦您阅读并使用过这本书,为什么不在这本书购买的网站上留下评论呢?潜在读者可以看到并使用您的客观意见来做出购买决定,Packt 公司可以了解您对我们产品的看法,我们的作者也可以看到他们对书籍的反馈。谢谢!

如需了解更多关于 Packt 的信息,请访问packt.com

第一部分:Tableau 入门

在本节中,你将了解 Tableau 的概念以及如何安装 Tableau Desktop。

本节包含以下章节:

  • 第一章,构建你的数据模型

第一章:构建您的数据模型

数据分析和可视化是相辅相成的。Tableau 允许用户执行深入的数据分析,并通过交互式可视化共享结果。Tableau 包含许多数据建模功能,使用户能够理解数据并获得有意义的洞察,而无需处理高级数据库概念。数据建模是一个重要的概念,您处理的数据越多,它就越重要。

随着我们处理的信息量的增加,我们需要能够高效地执行分析。数据建模不仅使我们能够为我们的分析做好准备,而且还能使其尽可能高效。最终,我们使用数据来帮助我们做出更好的决策。花时间学习我们如何建模数据将帮助我们确定我们可以回答哪些问题,以及如何回答这些问题。无论您正在处理的数据量有多大,Tableau 都将帮助您轻松地获得洞察力。

本章将解释如何连接到您的数据,并使用 Tableau 的数据建模功能开始您的分析。

本章将涵盖以下主题:

  • 初始准备

  • 连接到您的数据

  • 构建您的数据模型

  • 准备您的数据

技术要求

本章使用全球超市数据集,可以在www.tableau.com/sites/default/files/getting_started_data_sets.zip找到。

一旦提取,您将看到两个文件:

  • Global Superstore Orders 2016

  • Global Superstore Returns 2016

我们认为,跟随示例学习是学习并熟悉任何应用程序的最佳方式。请使用本章提供的示例进行学习,或者找到您感兴趣的数据集。

初始准备

在连接到您的数据之前,您需要做一些事情。首先,您必须寻找能够回答您问题的数据。一旦您验证了数据的存在、存储位置以及如何获取访问权限(如果需要的话),您就可以开始了。在大多数情况下,您将直接使用用户名和密码连接到数据库。然而,您也可以连接到您本地机器上的文件,例如 Excel 工作簿。如果需要,您甚至可以结合使用这两种方式。

全球超市数据集

全球超市数据集来自一个虚构的全球零售连锁店,该连锁店销售办公用品。在现实世界中,您很可能会连接到数据库;然而,处理 Excel 文件的方式类似——Excel 中的工作表类似于数据库中的表。这些工作簿中的数据类似于您在数据库中看到的数据。

全球超市数据集包含一个 Excel 工作簿和一个 Excel CSV 文件:

  • Global Superstore Orders 2016 (.xlsx)

    工作表 1:Orders

    工作表 2:People

  • Global Superstore Returns 2016 (.csv)

    工作表 1:Global Superstore Returns 2016

Orders工作表包含销售数据,其中每条记录(行 ID)代表一笔单独的交易:

图片

People工作表包含人员到地区的映射:

图片

Global Superstore Returns 2016工作表包含按地区返回的订单 ID:

图片

我们已经找到了我们分析所需的数据,我们知道它的位置,并且可以访问使用它。现在我们将继续使用 Tableau 连接到数据源。

通过查看一些记录来了解您正在处理的数据总是一个好主意。如果您正在处理 Excel 文件,请在 Excel 中打开它,以了解数据集。

连接到您的数据

在深入数据之前,您必须先连接到它。Tableau 允许您连接到众多数据源。您可以连接到本地机器上的文件,到服务器上的数据库或其他数据库源。Tableau 允许用户连接到众多数据源——要查看完整列表,请访问 Tableau 的网站以查看全面且最新的列表。您可以在启动页面的连接面板中找到可以连接的数据源类型。您最近连接的文件也将显示在此页面上。

根据您使用的 Tableau Desktop 版本,您将能够访问不同的内置连接器。搜索您所需的连接类型以连接到您的数据。如果您正在连接到常用连接器,那么它几乎肯定可用。如果您需要连接的文件或数据库在连接面板部分不可用,您可以使用其他数据库(ODBC)或 Web 数据连接器创建自定义连接。您可以通过点击“更多...”按钮(位于“到文件”或“到服务器”部分下)在连接面板中查看 Tableau 允许的所有原生数据连接类型列表:

图片

如果您要连接的数据源在连接面板中不可用,请在网上进行一些研究。社区通常会提供一些有用的建议,帮助您解决可能会遇到的问题或问题。

现在我们将转到连接到 Global Superstore Orders 数据集。

连接到 Global Superstore 数据集

在连接面板中点击 Microsoft Excel 按钮。它将在“到文件”部分下。您的文件浏览器窗口将打开。导航到并打开Global Superstore Orders 2016Excel 文件:

图片

连接到数据源后,您将被带到数据源屏幕。从该屏幕,我们可以选择我们想要在分析中使用哪些表(在这种情况下,工作表):

图片

在“连接”面板(在“工作表”部分下)中双击“Orders”表格图标,或将“Orders”表格图标拖放到画布上。然后你将在画布中看到订单(左侧有一个带有蓝色边框的矩形名称图标)。你还会在数据网格中看到 1,000 行的样本。 我们之前提到,在开始处理数据之前查看数据非常重要。数据网格是这样做的一种简单方式。

“数据源”页面允许你准备分析数据。一旦连接到数据源,你就可以更改 Tableau 导入和解释表格的方式。 看看前面的截图,它显示了连接到并从“全球超级商店订单 2016”数据集导入订单表后的“数据源”页面。

“数据源”页面有四个主要部分。以下截图中突出显示了这些部分。接下来,我们将详细查看这些部分,从左侧面板开始:

左侧面板

左侧面板显示了已连接数据源的联系细节。此部分允许你使用添加按钮添加额外的数据源连接。

当连接到平面文件(例如 Excel)时,连接部分将显示你连接到的 Excel 工作簿以及在此列出的工作表。在前面的截图中,Global Superstore Orders 2016是 Excel 工作簿,工作表是OrdersPeople

当连接到数据库时,左侧面板将显示服务器名称、数据库、模式和以下截图中的表格:

如果你将鼠标悬停在连接名称的右侧,会出现一个向下箭头。这允许我们对连接进行额外更改,例如重命名它。

你可以通过将鼠标悬停在表格名称的右侧,然后点击查看数据图标来查看你连接到的任何表格中的记录。这在上面的截图中显示:

这将导致以下弹出窗口:

如果你需要返回起始页面,请点击屏幕左上角的 Tableau 标志(在文件下)。

画布

画布显示数据导入详情以及建模选项(连接、跨数据库连接、数据混合、自定义 SQL 和数据准备)。你在“连接”面板中看到的表格就是你能够访问的。在将左侧面板中的表格拖放到画布(或双击)后,你将在画布中看到它们。你只能处理已导入画布中的数据。

一旦表格已导入画布,你可以通过双击矩形名称图标来重命名它。

当您将鼠标悬停在画布中的订单图标上时,会出现一个向下箭头图标。单击它以查看可以对表进行的其他修改。您可以在以下屏幕截图中看到下拉菜单以及选项:

图片

数据网格

数据网格是导入数据的表格视图(默认显示为前 1,000 条记录的视图)。以下屏幕截图显示了数据网格以及记录的样本:

图片

您可以通过双击名称来重命名列,如下面的屏幕截图所示:

图片

连接到数据源后,Tableau 会自动识别列的数据类型。偶尔,,列会被错误分类。例如,Tableau 可能会将包含日期的字段解释为整数数据类型,而不是日期数据类型。您可以通过单击数据类型图标并选择新的数据类型来更改列的数据类型,如下面的屏幕截图所示:

图片

当您将鼠标悬停在列名右上角时,会出现一个向下箭头。这允许我们对列进行额外的属性更改。您可以在以下屏幕截图中看到下拉菜单以及选项:

图片

在 Tableau 中,通常有多种方式来完成同一项任务。找出最适合您工作流程的方法,并坚持使用它。

元数据网格

元数据网格允许您快速查看已导入的字段、源表和远程字段名(字段在数据源中的名称)。单击管理元数据图标(位于排序字段左侧)以获取数据源结构的概览。

您可以对列执行与数据网格视图中相同的所有操作(例如,重命名列,更改列的数据类型等)。以下屏幕截图显示了在管理元数据视图中如何呈现字段名、表和远程字段名:

图片

一旦将表导入到画布中,您可以通过单击管理元数据图标来快速探索字段名和数据类型。这是一个验证您正在导入内容的绝佳视图。

在下一节中,我们将讨论在构建可视化之前必须完成的事情。

构建您的数据模型

构建你的数据模型包括你在分析之前如何组合你的数据。在确定数据模型结构时需要考虑许多因素——数据的数量、数据的类型、数据的粒度、数据源的数量等等。数据源页面是我们设置 Tableau 如何解释数据源数据的页面。我们在该页面上修改的设置告诉 Tableau 数据在哪里(例如,网络位置、服务器名称等)以及哪些数据可用,并允许我们自定义导入的数据(例如,更改字段名称、基于计算创建新列等)。

Tableau 允许你轻松地将来自不同来源的数据组合在一起。以下是我们在数据源页面上可以如何将数据连接在一起的各种方式。

  • 来自单一数据源的数据:当只需要一个表格时,工作流程很简单——只需将表格名称(或双击)从左侧面板拖动到画布上。你只需要建立一个数据连接。

  • 来自单一数据库但多个表格的数据:当在同一个数据库中使用多个表格时,画布会给你提供连接和合并表格的能力。你只需要建立一个数据连接。

  • 来自多个数据库和多个表格的数据:如果你连接到多个数据库并且需要使用来自许多表格的数据,则可以使用跨数据库连接。

  • 数据混合:这显示了来自两个不同来源且粒度不同的数据。你需要建立多个数据连接。

现在我们已经对数据源页面上的功能有了大致的了解,接下来让我们看看如何进一步细化我们的数据模型。

准备你的数据

一旦定义了数据源,你就可以应用各种操作来帮助你整理数据,以便进行分析。我们将首先讨论数据类型以及如何处理它们。

处理数据类型

如果你之前从事过数据分析工作,你就知道与正确的数据类型一起工作是多么重要。Tableau 允许用户在几个不同的地方进行所有常见的数据类型转换。我们将在接下来的章节中更详细地讨论数据类型,但请记住,你可以在元数据面板中更改数据类型。Tableau 中的可用数据类型在以下表中展示:

图标 数据类型
文本(字符串)值
日期值
日期和时间值
数值
布尔值(仅关系型)
地理值(用于地图)
图片 聚类组 (help.tableau.com/current/pro/desktop/en-us/clustering.htm)

连接到您的数据后,点击页面中央的“管理元数据”图标(位于“排序字段”下拉菜单的左侧)。元数据网格视图将出现:

图片

要更改字段的类型,请点击字段名左侧的数据类型图标。在这里,您可以在数据类型之间进行转换。面板中还有各种地理数据类型:

图片

您可能想要更改数据类型的一个例子是,当您将日期作为字符串而不是日期导入时。您可以点击图标并将其转换为日期字段,而无需对源数据进行任何更改。

数据转换

如果您之前使用过 Microsoft Excel 或表格格式的数据,您可能已经进行过数据转换。通常,当数据以交叉表格式存在时,您会想要转换数据以便在 Tableau 中使用。虽然宽数据可能适合于报告,但在进行分析时,数据应该是长的。连接到您的数据源后,选择多个列。点击列名右上角的下拉箭头,然后在菜单中点击“转换”选项:

图片

您之前选择的列将被转换。在您进行任何转换后,始终验证您的数据;这将使您对分析结果充满信心。您可以通过类似的方式向转换中添加或删除额外的列 – 点击您感兴趣的域的下拉箭头,然后按照说明操作:

图片

您可以使用自定义 SQL 将数据库中的表数据进行转换。请注意,Tableau Desktop 中的数据转换选项仅适用于选定的数据源,例如文本文件、Google 表格、Microsoft Excel 和 PDF 文件。如果您正在使用 SQL,则必须使用自定义 SQL 来转换您的数据。

拆分字段

如果您的某个字段是字符串类型并且您需要将其拆分,您可以使用 Tableau 的拆分到多个字段选项。当您在数据网格中的数据源页面上时,点击列旁边的下拉箭头图标,然后点击“拆分”选项。拆分将是自动的,但如果您点击“自定义拆分...”选项,您可以获得更多控制拆分的能力。在使用自动拆分选项时,字段将根据 Tableau 识别的公共分隔符进行拆分。在以下示例中,它是在名字和姓氏之间的空格。

您可能想要使用此选项的一个例子是,如果您有一个列中有全名,并且需要在不同的列中分别有名字和姓氏:

图片

在拆分列之后,你可以看到出现了两个新的列——一个包含名字,另一个包含姓氏。你可以通过双击列名来重命名列:

图片

数据过滤

Tableau 是为处理大数据而构建的,但随着数据量的增加,你的性能会受到冲击。管理分析性能的最好方法之一是限制 Tableau 需要读取的数据量。在数据源页面上,你可以包含一个数据源过滤器。

要添加数据源过滤器,请点击画布的过滤器部分中的添加按钮。将出现一个编辑数据源过滤器菜单。点击添加并选择你想要应用的过滤器。你可以使用相同的方法添加更多过滤器或删除已添加的过滤器:

图片

合并数据

在进行数据分析时,你经常会处理多个表格中的数据。Tableau 允许你使用多种方法结合数据源。以下是最主要的四种方法:

  • 连接

  • 跨数据库连接

  • 工会

  • 混合

以下部分将详细解释这些方法。

连接

通过连接数据,你可以使用公共字段合并表格以执行分析。你可以将连接表格视为通过从源表添加列到目标表来扩展表格。你可以在 Tableau 中使用公共字段(存在于两个表格中的列)合并表格。根据相关字段,我们可以合并多个表格中的行。如果你使用的表格来自同一来源(数据库、工作簿等),则该过程涉及单个连接。使用来自同一数据源的表格进行计算更有效;然而,这不是必需的。

Orders 表格应该已经位于画布中。

双击或拖动 People 表格到画布上(画布中每个表格名称的矩形图标之间将出现一个内连接图标)。

选择/更改连接类型(当将新表格拖入画布区域时,Tableau 将寻找用于连接的列——在我们的例子中,它已经连接在 Region 上,这是两个工作表中的列)。

你可以点击蓝色的内连接图标来更改表格连接的方式。你可能想要编辑连接类型(例如,内连接到左连接)或者甚至通过添加更多条件来编辑子句本身。以下截图显示了 OrdersPeople 工作表之间连接的结果:

图片

你可以在连接后查看数据网格中的数据,以直观地检查错误。

连接类型

Tableau 支持所有四种基本的 SQL 连接类型:内连接左连接右连接全外连接。在连接数据之前,你必须验证用于连接的公共字段的数据类型是否相同:

连接类型 描述 连接的维恩图
内连接 结果集包括两个表中都有匹配值的所有记录。对于全球超级商店订单 2016 的示例,这将返回 Orders 表中所有在 People 表中有匹配人员的记录。
左连接 结果集包括左表(Orders)中的所有记录以及 People 表中的匹配记录。对于没有匹配的记录,将出现 NULL 值。
右连接 结果集包括右表(People)中的所有记录以及 Orders 表中的匹配记录。对于没有匹配的记录,将出现 NULL 值。
全外连接 结果集包括两个表中的所有记录,无论是否有匹配。

Tableau 中可以连接的最大表数是 32。表也有 255 列的限制。

关于连接的一些说明如下:

  1. 点击并拖动(或双击)左侧面板中的第二个表到画布上。

  2. Tableau 将自动尝试从两个数据源中检测到一个公共字段,以便连接两个表。

  3. 点击连接图标以更改连接类型或通过添加/删除附加子句来更改连接操作。完成后,关闭连接对话框。

  4. 验证连接,以便数据面板将反映您希望 Tableau 在数据网格中如何摄取数据。要删除连接,请点击连接条件旁边的 x 按钮图标。

接下来,我们将继续介绍类似类型的连接——跨数据库连接。

跨数据库连接

跨数据库连接是在不同数据库中的两个或多个表之间进行的内部、左、右或全外连接。您经常会遇到包含不同信息的多个数据库系统。订单信息可能存储在 Amazon Redshift 数据库中,而商店位置信息可能存储在 SQL Server 数据库中。要连接来自不同来源的信息,您需要使用跨数据库连接。

数据可能存在于不同的数据库中可能有多个原因,但这超出了本章的范围。

提到的四种连接类型在跨数据库连接中都是可用的。跨数据库连接需要一个多连接数据源设置。这意味着您需要为要连接的每个表创建到每个数据库的新连接。我们已连接到 Global Super Orders 2016 Excel 工作簿并引入了 Orders 表。我们希望将订单与 Returns 表连接起来,但它位于不同的文件中(Global Superstore Returns 2016.csv)。

虽然我们正在处理平面文件中的数据,但与数据库一起工作时过程类似。每个连接都将指向数据库而不是平面文件。

在下面的屏幕截图中,我们可以看到我们连接到了一个数据源(Global Superstore Orders 2016)。Orders 工作表已经被导入到画布上:

要将 Returns 表连接到 Orders 表,通过点击连接面板中的添加链接选项连接到 Global Superstore Returns 2016。从这里,导航到文件并双击它:

一旦添加了第二个连接,你将在现有的连接下看到连接名称以及连接面板文件部分下的所有表。双击 Global Superstore Returns 2016 表名称(或将其拖放到画布上),Tableau 将尝试自动连接这些表。在我们的例子中,连接是在 Order ID 列上完成的,这是两个表中的公共字段:

当你进行交叉连接表时,Tableau 将根据它们的来源进行颜色编码。请注意,画布上的 Orders 表有一个蓝色的左边界,表示它来自 Global Superstore Orders 2016 工作簿。同样,来自 Global Superstore Returns 2016 平文件的表在画布上有一个橙色的左边界。画布上矩形表按钮的边框对应于其连接的颜色。在执行跨数据库连接后查看数据网格时,列的顶部边框将根据连接名称进行颜色编码。

以下是一些关于跨数据库连接的说明:

  1. 点击连接面板中的添加按钮以添加新的连接。在连接存储在该源中的表之前,必须先建立到另一个数据源的连接。

  2. 在新连接下选择第二个表,然后点击并拖动(或双击)左面板中的第二个表到画布上。Tableau 将自动尝试使用公共字段连接表。

  3. 点击 连接 图标以更改连接类型或通过添加/删除附加子句来更改连接操作。完成后,关闭 连接 对话框。

  4. 验证连接是否正确完成。数据网格将显示连接后的数据结果,这应该有助于你轻松地识别连接中是否存在问题。

跨数据库连接非常强大,因为它们通常是连接来自不同数据库的表的最简单方式。

接下来,我们将描述 Tableau 如何进行数据并集。

并集

并集是另一种合并数据的方式。当你将两个表进行并集操作时,你会将一个表的行追加到另一个表中。由于你实际上是在一个表上堆叠另一个表,因此必须满足一个重要的条件——将要堆叠的列的数据类型需要兼容。你不应该在文本列上堆叠日期列。

下表包括联合操作的描述以及一个维恩图,以帮助您可视化联合操作的工作方式:

联合 描述 联合操作的维恩图
联合 联合的结果集是第一个表的所有记录附加到第二个表的所有记录上。 图片

为了说明联合操作,我们将把“订单”表附加到自身;这将产生一个结果集,其中每个记录都被复制。请确保“全球超级商店订单 2016”连接被高亮显示,然后点击并拖动“订单”表到画布上,覆盖已经存在于画布上的“订单”表矩形按钮。将其放下:

图片

您将在“订单”表图标右侧看到一个加号符号,以及在其下方露出的表图标。这表示联合操作成功:

图片

如果您右键单击“订单”表图标,将出现一个子菜单。点击编辑联合...:

图片

特定(手动)菜单允许您查看您的联合中有多少个表。您还可以通过在特定(手动)菜单的画布上拖动表来联合表:

图片

第二种选项是让 Tableau 根据您设置的通配符条件自动将表包含到您的连接中。这在您希望附加具有不同日期后缀的多个表时非常有用:

图片

在 Tableau 中,您不能从不同的数据库中联合表(跨数据库联合),但这可能在未来的更新中改变。虽然您不能从不同的数据库中联合表,但您可以从不同的 Excel 工作簿中联合表(工作表)。Tableau 发布了一个名为Tableau Prep Builder的工具,允许您跨多个连接联合数据,但这超出了本章的范围。有关 Tableau Prep 的更多信息,请访问产品页面www.tableau.com/products/prep

接下来,我们将讨论混合操作及其与连接操作的不同之处。

混合

与连接和联合操作类似,数据混合允许您处理来自不同来源的数据。混合操作允许您在同一视图中展示来自两个或更多来源的数据。混合操作与连接操作的区别在于,当您进行混合操作时,您并不是在行级别合并数据。混合操作是一种关系。它允许来自不同来源的数据在同一张表中显示。当您需要展示来自两个不同来源且粒度不同数据时,主要使用数据混合操作。

当您连接到数据库时,Tableau 会自动在连接图标旁边显示蓝色勾选标记(见以下截图)。蓝色勾选标记表示它是主要数据源,或第一个连接的数据源。添加第二个连接后,将出现一个额外的图标,这次带有橙色勾选标记。混合的说明如下:

  1. 确保工作簿包含至少两个数据源。您可以通过在菜单中单击数据 > 新数据源来完成此操作。

  2. 主要数据源是带有蓝色勾选标记的数据库图标;带有橙色勾选标记的数据库图标是次要源。在数据面板中单击次要数据库图标以使用此源的字段。

  3. 橙色链接图标表示用于混合数据源的字段。如果链接图标为灰色,请单击它以激活混合。

  4. 使用与在主要数据源中一样的方式使用次要数据源的字段。

以下截图显示了成功混合后数据面板的显示:

在分析之前,我们已经学习了如何连接、准备和连接我们的数据。在下一节中,我们将总结本章所学的内容。

摘要

我们已经了解了在 Tableau 中建模数据的一些方法。在这个阶段,您知道如何连接到数据源。您也应该看到数据源页面在建模数据时的重要性。如果您使用本节中可用的许多功能,您的生活会变得容易得多。

在 Tableau 中进行数据建模的主要收获是它帮助您准备工作区,以便使用数据来回答问题。花时间了解您的业务或项目需求将有助于您进行更好的分析。Tableau 允许您快速连接并构建可视化,但不应忽略数据源页面。Tableau 还通过新版本添加了额外功能。在下一章中,您将学习如何使用您已准备的数据开始构建您的可视化,以便分享见解。

问题

回答以下问题以测试您对本章信息的了解。

  1. 要连接到多个数据源中的多个表,必须指定什么?

a. 一种混合

b. 数据库间连接

c. 连接

A: b. 数据库间连接

  1. Tableau 支持哪些类型的连接?

A: 内连接,左连接,右连接和全外连接

  1. 您可以在 Tableau 的数据源页面中更改字段的类型。

a. 正确

b. 错误

A: a. 正确

  1. Tableau 有行数限制。

a. 正确

b. 错误

A: b. 错误

进一步阅读

您可以查看以下链接以获取有关本章所涵盖主题的更多信息:

第二部分:用数据回答问题

在本节中,你将使用从前几章学到的知识,通过使用 Tableau 功能和连接不同的数据源来练习回答问题。

本节包含以下章节:

  • 第二章,使用工作表

  • 第三章,使用图表分析数据

  • 第四章,可视化地理数据

  • 第五章,理解 Tableau 中的简单计算

第二章:使用工作表

现在我们已经连接到我们的数据源,我们可以开始获取洞察。您将使用工作表标签来发现这些洞察。工作表是您将使用连接到的数据构建图表和表格的地方。如果您以前使用过 Microsoft Excel,Tableau 的工作表结构应该很熟悉。工作簿是您打开的 Tableau 文件。在工作簿内,您将处理工作表。有三种不同类型的工作表:

工作表图标 工作表描述
图片 工作表 – 这是您将在此处处理数据的初级工作空间。
图片 仪表板 – 这是一个包含筛选器的单页工作表集合,用于个性化视图。
图片 故事 – 这是一个按演示格式排列的工作表和/或仪表板的集合。

本章将解释如何使用 Tableau 的工作表进行您的分析。本章将涵盖以下主题:

  • 工作表简介

  • 探索数据和数据分析面板

  • 柜架和卡片

工作表简介

连接到数据源后,您将在下方的菜单栏中看到一个名为 Sheet1 的工作表标签。点击它:

图片

工作表页面包含许多项目(菜单、工具栏、面板、卡片、柜架等)。您可以将工作表视为您将绘制故事或展示您希望呈现的数据视图的画布:

图片

我们将在这里介绍工作表的各个组成部分:

部分 描述
A 工作簿菜单:这包含工作簿名称、主菜单和 Tableau 工作簿的选项。
B 数据源页面:点击此图标可进入数据源页面。
C 数据和数据分析面板:这包含数据源的字段以及操作和组织选项。
D 卡片:将字段从数据面板拖到卡片上,以编辑和格式化可视化。
E 柜架:将字段从数据面板拖到柜架上,以将数据添加到您的视图中。
F 工具栏:这提供了工作表的面板和数据分析选项。
G 视图:这是您创建可视化的画布。
H 工作表:这些是创建附加工作表、仪表板和故事的标签。
I 状态栏:显示视图中的字段摘要。

现在你已经熟悉了工作表的主要项目,我们将更深入地探讨每个单独的组件。我们将从查看工作簿菜单开始。

工作簿菜单

工作簿菜单包含与工作簿相关的选项。点击工作表按钮后,将显示选项面板。您可以使用此菜单创建新的工作表、格式化工作表以及其他选项。工作簿的名称显示在菜单上方(例如('Book2')):

灰色的选项不可用。当您在工作表上处理数据时,当满足条件后,选项将变为可用。例如,清除按钮变灰是因为工作表为空。一旦数据出现在视图中,清除选项将变为可用。

工具栏

在工作表上处理数据时,您可以执行常用的操作。我们将介绍位于工作簿菜单下方的工作表工具栏的各个组件。您可以通过点击窗口 > 显示工具栏来显示或隐藏工具栏:

按钮 描述
表格au 图标:点击此图标可进入数据源页面。
撤销:此操作将撤销最后执行的操作。在同一个会话中,您可以无限次地撤销操作。操作不会在会话之间保存。
重做:此操作将重做最后执行的操作。在同一个会话中,您可以无限次地重做操作。操作不会在会话之间保存。
保存:此操作将工作簿保存(默认使用.twb扩展名)。
新建数据源:点击此图标可进入连接面板页面。
暂停自动更新:当您对工作表中的数据进行更改时,当前视图可能会发生变化。工作表刷新的速度取决于许多因素,其中之一是与它连接的数据的大小。当处理大型数据集时,暂停视图直到所有更改都已完成通常是有益的。这可以提高性能,因为您不需要在每次操作后等待视图刷新。点击暂停自动更新图标右侧的下箭头,可以自定义视图刷新的方式。
运行更新:如果您已启用暂停自动更新,则可以使用运行更新按钮手动刷新视图。
新建工作表:此操作将创建一个新的工作表。点击下箭头可以选择创建新的工作表、仪表板或故事。
复制工作表:创建当前工作表的副本。
清除工作表:清除当前工作表。点击清除工作表图标右侧的下箭头,可以自定义清除视图的方式。
交换行和列:此功能用于在列和行架中交换字段。
按字段升序排序:此功能按所选字段升序排序数据。
按字段降序排序:此功能按所选字段降序排序数据。
高亮操作:此功能用于启用/禁用当前工作表的突出显示功能。启用突出显示后,您可以选择一个字段作为突出显示器。向下箭头将显示可用于突出显示操作的可用字段列表。当字段用作突出显示器时,它将告诉可视化哪些标记需要突出显示。
分组成员:使用此功能快速分组字段的成员。您必须选择多个字段标题才能使此选项可用。
显示标记标签:此功能用于启用/禁用可视化中的标记标签。
固定轴:当从数据面板添加连续字段到架时,在可视化中生成一个轴。使用此按钮选择锁定或动态轴。

| | 固定大小:选择如何调整视图的大小。从以下选项中选择:

  • 标准:视图会根据窗口的大小自动调整大小。

  • 适应宽度:视图的宽度包括窗口的整个宽度。

  • 适应高度:视图的高度包括窗口的整个高度。

  • 整个视图:视图设置为窗口的整个大小。

|

显示/隐藏卡片:选择要在工作表上显示的卡片。单击显示/隐藏图标右侧的向下箭头以自定义卡片选项。
演示模式:此功能激活全屏视图。
与他人共享工作簿:点击以将当前工作簿发布到 Tableau Server。
显示我:在此处选择您将创建的视觉类型。

在 Tableau 中通常有几种执行相同操作的方法,利用工具栏可以节省时间。理解这些常见操作是开发可视化的重要部分。花时间玩一下工具栏上的按钮。记住,您始终可以使用撤销按钮来撤销更改。

探索数据和分析面板

数据和分析面板是两个不同的面板。数据面板是您将处理数据源中的字段的地方。分析面板是您将应用各种分析工具和技术到您视图中的数据的地方。分析面板中的选项在您在数据面板中处理数据之前将不可用(灰色显示)。

数据面板

数据面板显示您数据源中所有可用的字段。连接到数据源后,字段被分类为两种角色之一——维度或度量。维度在设置在架子上时表示为蓝色药丸,而度量是绿色的。数据面板中图标的颜色也对应于角色。

在数据源页面(数据网格)中的字段操作选项在右键单击字段后也可用。以下截图显示了数据面板及其可用字段:

图片

您可以使用数据面板中的选项创建额外的字段类型,我们将在以下章节中描述。

数据面板字段

在设置数据源页面后,Tableau 将导入的数据分类为类型。共有六种数据类型:

数据图标 数据类型 描述
图片 布尔 值为两个值之一(例如,truefalse
图片 日期 日期值(例如,2009-01-20
图片 日期和时间 日期和时间值(例如,2009-01-20 12:00:00
图片 地理 地理值,例如国家或邮政编码(例如,USA74104
图片 数字 数字值(例如,4
图片 文本 字符串值(例如,Washington

您可以随时更改字段的 数据类型。Tableau 在导入阶段会分配数据类型。您可以使用数据源页面或数据面板手动编辑数据类型。

这六种数据类型属于两种数据角色之一:

  • 维度(蓝色字段):这些字段是布尔型、日期、日期和时间、地理和文本值数据类型(即定性数据)。维度是您分析中显示的详细程度。

  • 度量(绿色字段):这些字段是数字数据类型(即定量数据)。度量是数字。它们也可以根据您定义的条件进行汇总和聚合。默认情况下,Tableau 会汇总度量。

以下示例展示了使用一个维度(国家)和一个度量(利润)的可视化。注意维度字段在列架上为蓝色,而度量字段在行架上为绿色。蓝色药丸是离散的,而绿色药丸是连续的:

图片

维度和度量也可以是连续或离散类型。再次使用字段的颜色来帮助你识别这两个类别。你可以通过右键单击字段并在菜单中选择离散或连续来更改字段的类型:

图片

了解连续和离散字段之间的区别是一项重要的技能。你应该花些时间研究这些区别。以下部分提供了一个总结。

连续数据

连续数据可以是范围内的任何数字(范围可以是无限的)。数字的可能性是无限的。例如,身高是连续的。根据吉尼斯世界记录验证的最矮的人身高为 21 ½英寸。最高的人身高为 99 英寸(8'3")。将 21 ½英寸视为数轴的开始,将 99 英寸视为数轴的结束。一个正常人的身高可以取数轴上的任何值:

图片

离散数据

离散数据是可数的且是不同的——它只能取某些值。例如,你拥有的父母数量是离散的——你不能有一半的父母。在以下示例中,数量被定义为(1,2,3,...,14):

图片

在前面的部分中,我们讨论了数据在数据面板中可用时的不同数据类型和角色。在以下部分中,我们将讨论如何通过创建集合来根据字段值对数据进行分组。

集合

集合可以是静态的或动态的(基于底层数据变化)。集合是通过数据面板中的字段或可视化中的标记定义的(非动态)。你可以将集合视为数据的分组或过滤结果。创建集合的一种方法是在数据面板中的字段上右键单击,然后选择创建 - 集合选项。在下面的屏幕截图中,我们将基于国家字段中的值创建一个集合:

图片

将出现编辑集合菜单。通过单击每个值旁边的复选框选择您所需集合的所有字段值。在以下示例中,所有以字母A开头的国家都被选中。这个集合的名称是以 A 开头的国家。创建的集合显示在度量部分下面的数据面板中:

图片

下一个部分将解释如何使用户能够编辑用于过滤和计算中的值。

参数

参数是用户可以更改的动态值。这些值用于计算,以便结果取决于用户的输入。参数是一个极其强大的工具,允许在计算中动态设置值。要创建参数,可以点击数据面板中的向下箭头,或者在数据面板的任何位置右键单击并从菜单中选择创建参数。以下屏幕截图说明了此过程:

编辑参数菜单需要一些信息。在此示例中,我们将参数命名为 Multiplier。数据类型是整数,这意味着它将只接受用户输入的整数。当前值是默认值(设置为 1),显示格式是值的格式。允许的值部分说明用户是否可以从预定义值列表(列表)中选择任何值(全部),或在一个预定义的值范围内选择(范围)。以下屏幕截图显示了编辑参数菜单:

在以下屏幕截图中,使用 Multiplier 参数创建了一个计算字段。该计算字段命名为 p. Profit * Multiplierp. 前缀将作为视觉提示,让我们知道该字段使用了一个参数。此计算的結果将是 Profit 乘以 Multiplier 参数(用户选择的整数):

使用 p. 前缀是作者偏好的最佳实践,以便更容易识别字段。在创建字段时,请随意遵循自己的命名偏好。

以下可视化展示了 Marks 卡片中的两个度量(绿色区域):SUM(Profit) 和 SUM(p.Profit * Multiplier)。利润的值为 1,426,457。p.Profit * Multiplier 的值为 2,934,915。这是利润翻倍,因为 Multiplier 被设置为 2(参见 Multiplier 参数控制中的值)。如果设置为 3,则利润会乘以 3,依此类推:

我们将在下一节中更详细地解释计算字段。

计算字段

在前面的示例中,我们创建了一个计算字段——一个原始数据源中不存在的字段。要创建计算字段,可以点击数据面板中的向下箭头,或者在数据面板的任何位置右键单击并从菜单中选择创建计算字段。如果我们想计算利润率,我们可以使用计算字段。利润率是利润总和除以销售总和,请参考以下屏幕截图进行计算:

Tableau 提供了一个带有示例的计算字段参考指南(位于计算编辑器右侧)。

计算字段与其他字段一样被处理。根据计算字段的结果是定量还是定性,它们被分类为维度或度量。创建用于分析的字段的能力非常强大,并且是您会反复使用的功能。计算字段有许多用途。它们易于使用,并在您开始分析数据时帮助解决许多问题。我们将在后面的章节中了解更多关于计算字段的信息(参见第五章,理解 Tableau 中的简单计算,以及第六章,Tableau 表计算)。

在接下来的几节中,我们将描述如何保持您的数据面板井然有序。

层次结构

层次结构有助于在数据面板中组织数据。它们还使用户在可视化中钻取时更加方便。在以下示例中,我们正在创建一个地理层次结构。首先,右键单击国家字段并选择层次结构:

图片

一旦国家位于地理层次结构文件夹下,就将有三个额外的字段被拖放到地理层次结构文件夹下——州、城市和邮政编码。以下截图显示,当国家放置在行架上时,会出现一个+/展开图标。当用户点击此图标时,层次结构中的下一个项目将填充(州),依此类推。层次结构应该直观易懂:

图片

只有维度可以添加到层次结构中。要将度量添加到层次结构中,必须首先将其转换为维度。

您应该使用层次结构来创建更有序和高效的可视化。在下一节中,我们将讨论另一种在数据面板中组织数据的方法。

数据字段分组

当在数据面板中处理字段时,有一些方法可以帮助您保持有序。其中之一是将类似的字段放在文件夹中。要创建文件夹,右键单击数据字段并选择创建文件夹按钮。一旦创建了一个文件夹,就可以将字段拖放到文件夹下,就像我们对层次结构所做的那样:

图片

默认的组织方法是将字段按数据源表分组。

替换引用

之前,我们创建了一个计算字段,该字段将利润乘以Multiplier参数。如果我们想用另一个字段替换利润,我们可以手动完成。然而,如果需要在许多计算中替换相同的字段,这会变得很麻烦。Tableau 提供了一个解决方案。右键单击要替换的字段并选择替换引用:

图片

将出现一个菜单,您可以选择用哪个字段替换旧字段。在以下示例中,我们希望将所有利润的引用替换为折扣

图片

点击确定后,计算字段将使用替换的参考值更新。

如果您想了解特定字段的更多详细信息,请在数据面板中右键单击该字段并选择描述字段按钮。将出现类似于以下窗口:

图片

我们已经讨论了数据面板中可用的许多功能和选项。在下一节中,我们将突出显示 Tableau 分析面板中的一些工具和功能。

分析面板

要访问分析面板,请单击左侧侧边栏顶部的选项卡。分析面板允许用户总结并将各种分析技术应用于视图。可以通过从分析面板拖放到视图中来添加分析对象。如果分析面板中的对象变灰,这意味着根据当前视图中的数据类型,该对象不可用。在以下示例中,平均线对象(在摘要部分下)被引入到视图中:

图片

根据您希望使用的分析对象,有多种选项可供选择。对于普通行对象,可以选择设置平均值的范围——表级别、面板级别和单元格级别。分析对象辅助菜单(例如,添加参考线)应有助于您根据需求做出正确的选择。您可以将多个分析对象添加到一个视图中。要删除对象,右键单击视图中的项目并选择删除。

分析对象

分析对象位于分析面板中。对象分为三个类别——摘要模型自定义

图片

在以下各节中提供了每个对象的简要描述。

摘要

摘要部分允许您将计算应用于可视化中的数据。以下摘要计算可用:

  • 常量线:一条由用户设置的值的线。

  • 平均线:一条值为指定度量或度量的平均值的线。

  • 中位数与四分位数线:一条值为指定度量或度量的中位数,并带有分布带的线。

  • 箱线图:向视图中添加箱线图。

  • 总计:为字段中的值添加总计(子总计、列总计或行总计)。

模型

模型部分允许您将统计模型应用于可视化中的数据。以下模型可用:

  • 平均带 95%置信区间:这是值为指定度量或度量的平均值,并带有分布带的线。带设置为 95%置信区间。

  • 中位数带 95%置信区间:这是值为指定度量或度量的中位数,并带有分布带的线。带设置为 95%置信区间。

  • 趋势线:这是使用所选的趋势类型(线性、对数、指数和多项式)配置的线。

  • 预测:这是使用所选的预测模型类型(自动、自动带季节性或自定义)配置的预测。Tableau 预测基于指数平滑技术。指数平滑是一种赋予最近观察结果更多权重的技术。

  • 聚类:这根据用户选择的聚类数量应用聚类分析。

自定义

除了前几节中提供的汇总和模型对象之外,Tableau 还提供自定义对象:

  • 参考线:这是其值为指定字段常数或计算值的线。

  • 参考带:这是一个阴影带,其值是两个常数或指定字段的计算值之间的距离。

  • 分布带:这是一个阴影带,其值是指定字段值的分布。

  • 箱线图:这将在视图中添加一个箱线图。

在一个可视化中,您可以使用的分析对象数量没有限制。在下一节中,我们将讨论书架和卡片。书架是您放置字段以构建可视化的地方。卡片允许您添加细节并自定义可视化。

书架和卡片

字段放置的位置将影响可视化的布局。随着您更多地使用此工具,您将更好地理解如何最佳地构建可视化。您应该始终花时间尝试多种方法。

您可以通过拖放将字段添加到书架和卡片。您还可以在数据面板中双击字段,Tableau 将尝试使用最佳实践显示数据;然而,这并不总是产生期望的结果。

书架 - 列和行

将字段放置在列或行书架上将在视图中创建标题。重要的是要记住,可视化是通过标记构建的,这些标记只是数据源中的记录。您可以将多个字段添加到列和行书架。在以下示例中,市场和地区是按销售显示的行(条形图):

图片

在行和列书架上的药丸上右键单击以查看其他字段选项。

当字段放置在书架上时,Tableau 将尝试选择最佳图表类型。在前面的示例中,选择了条形图来显示市场和地区的销售。要更改图表类型,请使用应用右上角的“Show Me”图表指南。

“Show Me”图表指南

在以下示例中,两个字段(市场和销售)在数据面板中被突出显示。Show Me 图表指南表明,您可以使用这些字段创建 10 种可能的图表类型(请参阅着色的图表)。水平条形图类型以橙色边框显示,表示这是基于最佳实践的 Tableau 推荐图表类型:

图片

Tableau 的推荐图表类型通过分析特定字段来工作。然后,它根据数据的属性生成最有效的可视化类型的推荐。

知道使用哪种类型的图表是您在创建可视化时将做出的最重要的决定之一。有关此主题的更多信息,我们建议搜索有关如何为您的数据选择最佳图表类型的指南。

标记卡

标记卡是您将使用详细信息完善可视化的地方。在以下示例中,市场字段已添加到颜色标记,而销售总额已添加到标签标记。将这两个字段添加到标记卡中,按市场着色条形,并在条形右侧显示销售总额作为标签:

图片

标记卡有七个组成部分:

  • 形状:标记下拉菜单会更改视图中的可视化:

图片

  • 颜色:将字段拖放到颜色标记上,以更改可视化中标记的颜色。

  • 大小:将字段拖放到大小标记上,以更改可视化中标记的大小。

  • 标签:将字段拖放到标签标记上,在可视化中显示文本标签。

  • 细节:选择可视化中显示的数据的粒度级别。

  • 工具提示:当您将鼠标悬停在标记上时,会显示一个信息菜单,即工具提示。它们在传达关于标记的额外信息方面非常有用。

  • 形状:这会改变可视化中标记的形状。

虽然这些组件可能看起来微不足道,但它们对于可视化整体的外观和感觉至关重要。良好的设计应该是直观的。学习如何使用这些组件将帮助您的用户有效地消化信息。与知道为您的数据选择哪种图表类型一样,选择标记也是一种科学。

了解如何正确使用颜色、大小和形状将提高您可视化的质量。适当的标记使用使用户更容易理解和使用仪表板。我们建议您阅读有关仪表板设计原则的更多信息,以充分利用 Tableau 的标记选项。如果您正在寻找书籍推荐,我们强烈建议阅读 Stephen Few 的《信息仪表板设计:一目了然的数据监控》。这是一本学习如何构建有意义的仪表板的优秀指南。

在以下部分,我们将讨论如何使用过滤器添加交互性到可视化中。

过滤器面板

将字段拖放到过滤器架上,您可以对视图进行筛选。它还允许您让用户能够在工作表中筛选数据。在以下示例中,我们希望允许用户能够根据市场筛选视图。在将市场字段拖放到过滤器架后,会出现一个过滤器菜单:

图片

点击确定后,在过滤器架中的市场字段上右键单击,然后点击显示过滤器

您现在可以在屏幕的右侧看到市场过滤器。根据以下截图所示,添加或删除字段值旁边的复选标记以筛选视图:

图片

您可以通过点击市场过滤器中的向下箭头来编辑过滤器设置:

图片

有许多方法可以自定义工作表上的过滤器。尝试不同的设置以发现最适合您分析的方法。

页面架

页面架允许您根据字段的特定值创建不同的视图。在页面卡中最常用的字段是日期字段。在将日期字段放入页面卡后,您可以使用菜单查看数据在不同时间点的样子。在以下示例中,订单日期字段被添加到页面架上。订单日期页面菜单显示在屏幕的右侧。您可以向前或向后移动以查看按年汇总的销售总额。您还可以使用页面架中的字段创建动画可视化:

图片

在上一节中,我们学习了如何构建和改进可视化。构建一个好的可视化取决于许多因素。了解工作表页上的功能将帮助您构建易于使用和理解的、对最终用户友好的有效可视化。

摘要

在本章中,我们学习了工作表页的组件和功能。您应该熟悉导航工作表页、在数据面板中处理字段、应用分析函数以及创建可视化的操作。正如本章开头所述,工作表是您绘制故事的画布。熟悉工作表将使您能够讲述最佳故事。

在下一章中,我们将学习 Tableau 中可用的各种图表类型。我们还将讨论如何使用过滤器、集合和组以及进行快速分析。最后,我们将讨论格式化如何帮助创建更有效的可视化。

第三章:使用图表分析数据

现在您已经可以连接到数据并理解工作表的各种元素,是时候开始分析数据了。在 Tableau 中,数据分析与可视化是相辅相成的。数据可视化使我们能够快速理解和解释数据中的各种趋势。Tableau 提供了广泛的数据切片和切块选项,以及使用可视化、集合、过滤器、层次结构等以不同格式查看数据。本章将详细介绍这些格式。

本章将涵盖以下主题:

  • Tableau 中的关键图表

  • 对你的数据进行排序

  • 创建过滤器、集合、分组和层次结构

  • 格式化你的视觉元素

技术要求

本章使用的是全球超级商店数据集,可以在www.tableau.com/sites/default/files/training/global_superstore.zip找到。

Tableau 中的关键图表

Tableau 提供各种图表,创建起来超级快速且简单。Tableau 中的所有图表都是基于标记创建的,其中标记是您数据集中任何给定维度和度量组合的行。要创建图表,您有两个主要选项:

  • 选择您想要绘制的维度和度量,然后点击显示我窗口。显示我窗口是一个特殊窗口,其中可以找到 Tableau 中的所有默认图表及其详细信息。例如,从维度中选择类别,从度量中选择销售额。使用Ctrl键(在 macOS 上为Command键)选择多个元素。

以下截图显示了显示我窗口:

如您所见,显示我窗口目前包含 24 个图表。然而,只有一个被一个红色的方框突出显示,七个其他的是激活的,其余的是灰色的。突出显示的图表是基于您的数据由 Tableau 推荐的图表。灰色显示的图表是无法通过所选字段的组合创建的。要发现生成图表所需的内容,只需将其悬停即可。例如,在这个条形图的例子中,我们可以看到,对于水平条形,我们需要 0 个或更多的维度和 1 个或更多的度量。同样,如果您将鼠标悬停在其他图表上,它将列出它们的要求。一旦您的数据满足要求,您可以选择图表类型,它将显示在屏幕上。

  • 将维度和度量直接拖放到工作表的标记架中。

以下截图显示了物品的组合,使用这些物品可以直接创建图表,而无需使用显示我窗口:

这些选项在增强显示我窗口的标准图表类型以创建更高级的图表时也将非常有用。

使用CategorySales,如果您想查看类别及其销售总额作为值列出,可以将Category拖到行上,然后将Sales拖到标记板上的文本标签上。这将创建如图(a)所示的图,如下所示。同样,如果您从文本板上移除SUM(Sales)并将其拖到列板上,您将得到如图(b)所示的水平条形图:

图片

重要的是要注意,无论何时您选择一个度量值将其带入工作表,它都会根据该数据的最佳聚合类型自动聚合。最常见的聚合类型是总和平均值。您可以选择更改度量的聚合类型。如果您不想将度量值作为聚合显示,您也可以取消选择聚合度量,并以无聚合的原始数据形式查看。

现在您已经了解了如何创建图表,我们将进入下一部分,其中我们将讨论重要的图表类型及其使用时机。

文本表格(交叉表)

文本表格类似于 Excel 网格,即它们在一个网格中包含行、列和值。当数据有限且您想快速查看确切数字,或者需要找到类别之间的交点(相当于 Excel 中的单元格)时,这些表格非常有用。

例如,消费者细分市场中办公用品的总运输成本是多少?

要创建此表格,请按照以下步骤操作:

  1. 选择SegmentCategoryShipping Cost,然后从显示我窗口中选择文本表格图标(第一个图形)。

  2. 或者,将SegmentCategory分别放在列和行上,然后在标记文本板上放置SUM(Shipping Cost),如图下所示:

图片

我们可以快速看到,在消费者细分市场中的办公用品的运输成本为 195,935。在这个例子中,我使用了列中的Segment和行中的Category,但您可以根据需要反转这些设置。

要快速交换任何图形的行和列,您可以点击图中的交换按钮,如红色所示,或者直接使用Ctrl + W快捷键。

突出显示表格

突出显示表是前一小节中讨论的文本表(或交叉表)的扩展。通过将字段添加到标记颜色架中,可以获得突出显示表。它们对于快速查看数据趋势非常有用。例如,如果有人问您哪个产品和细分市场的销售额比消费者办公用品多,但利润较少,一种解决方法就是查看所有销售额比消费者办公用品多的细分市场,然后查看这些细分市场的利润,看它们是否比消费者办公用品的利润多或少。另一种查看方法是快速将SUM(Profit)拖到标记颜色架上,并将标记类型更改为正方形。这将创建本截图所示的图表:

图片

您可以迅速看出,仅从销售额来看,消费者细分市场中的家具和科技产品的销售额超过了办公用品。现在,看看利润的颜色,您会迅速知道家具的颜色比消费者浅,因此其利润较少。

默认情况下,Tableau 中用于“度量”的自动颜色渐变是从最低到最高。此外,默认情况下,任何低于 0 的值都是橙色,而大于0 的值是蓝色。

地图(符号和填充)

地图是 Tableau 中最重要的视觉元素之一,它能快速有效地帮助可视化任何类型的地理数据。要识别地理字段,请查找字段旁边的地球图标。根据地理字段,Tableau 会生成两个字段,纬度和经度。这些字段用于在地图上精确定位位置。不需要使用自动生成的纬度和经度字段;您也可以上传自己的地理编码,我们将在第四章可视化地理数据中更详细地介绍。

目前,我们的重点是“显示我”菜单中可用的两种地图类型:符号地图和填充地图。符号地图可以显示多达两个度量值,而填充地图只能显示一个。符号地图适用于显示非常细粒度的数据或需要在图表上表示多个度量值时。另一方面,填充地图对于显示单个度量值非常有效。它们也适用于低级别数据,例如城市或邮编级别的数据。

例如,要查看每个国家按“细分”划分的“销售额”分布,您将使用符号图表,如下面的截图所示:

图片

另一方面,要查看美国西海岸哪个州销售额最高,您可以使用填充地图,如下面的截图所示:

图片

仅仅一眼地图,我们就可以看出加利福尼亚州在西部海岸的销售额最高。

柱状图

柱状图是制作跨类别数据快速比较的最简单工具之一。柱状图在线性尺度上比较数据,并快速使数据点在不同维度上的比较变得容易。Tableau 在“显示我”菜单中提供了三种类型的柱状图变体:

  • 水平柱状图

  • 堆积柱状图

  • 并排柱状图

简单柱状图是在询问最大或最小值、哪些维度的值位于前五名或后五名等问题时使用的最佳图表类型。由于这些值都显示在线性尺度上,它们也适用于数据的快速近似。例如,哪个产品的销售额大约是销售额第二高的产品的一半?

阅读前面的问题,它看起来有点复杂,但可以使用“产品名称”和SUM(Sales)的柱状图快速解决。一旦图表根据销售额的降序值排序,我们得到以下柱状图:

图片

快速浏览图表显示,第二高的产品是诺基亚智能手机,销售额约为 70k。其中一半是 35k,再次快速浏览图表显示,所涉及的产品是思科智能手机。由于在此示例中使用的销售额值不是精确的,这为我们节省了计算时间,使我们能够快速得出结果。

你想要比较的维度的复杂性越高,你就可以越深入地嵌套你的柱状图以轻松获取结果。以下示例比较了类别、细分市场和市场的值:

图片

迅速出现一种模式,与消费者细分市场相比,在地区和类别中,消费者细分市场的销售额最高,而与企业和家庭办公室相比。我们还可以快速看到,虽然亚太地区在家庭办公室细分市场的技术类别中领先,但欧洲在家庭办公室细分市场的办公用品类别中是领导者。加拿大在所有细分市场和类别中的销售额最低。

柱状图是对比同一值与多个维度比较的最佳工具。

现在,让我们从简单的柱状图转到堆积柱状图。后者有助于理解比例。以下截图展示了使用堆积柱状图查看使用不同运输方式和细分市场的发货量的比例的示例:

图片

消费者类别在标准类运输方式下发货量占比最高。

如果要比较的维度太多,不要使用堆积柱状图,因为它可能会变得非常混乱。相反,使用并排柱或嵌套柱。

并列条形图提供另一种比较度量的方法。与堆叠条形图的主要区别在于,并列条形图中的轴保持不变。例如,如果我们将前面的堆叠条形图更改为并列条形图,我们得到以下结果:

图片

这是以不同格式呈现的相同信息。如果您想进行比较并需要绝对值比较,并列图是您要使用的。然而,如果您更感兴趣的是比较时的比例以及它们的变化,堆叠图则是您应该选择的。

堆叠条形图也通常用于表示总人口的比例。

例如,要查看按区域分布的销售百分比,您需要执行以下操作:

  1. 使用 RegionSUM(Sales)Ship Mode 创建一个简单的堆叠图表。

  2. 右键点击 Sum(Sales)。选择快速表格计算 | 总计百分比。

  3. 您会注意到图表上没有变化。这是因为表格计算没有作为“表”进行计算。要更改此设置,再次右键点击 Sum(Sales)。选择计算方式 | 表向下。

这应该会给出以下图表:

图片

热图和树状图

热图和树状图在寻找高度粒化和详细数据中的模式时非常有用。热图通过大小和颜色的组合来显示趋势。例如,在销售数量最高的区域中,哪个子类别的利润最低?为了回答这个问题,我们创建了一个类似于以下屏幕截图的热图:

图片

使用热图,我们可以快速根据方块的大小看到,中部地区销售数量最高,而其中的表格子类别利润最低。

树状图是另一种有用的图表类型,用于观察广泛趋势。它们允许您显示多达四个度量。例如,在以下屏幕截图所示的示例中,我们可以查看区域和市场的 SUM(Profit)(颜色)、SUM(Quantity)(大小)和 SUM(Discount)(文本值):

图片

我们可以一眼看出,中欧地区拥有最高的利润和销售额,总折扣为 531.8。另一方面,尽管销售额相当高,亚太地区东南亚的利润却相当低。该市场对所有市场的折扣值也最高,为 851.3。

圆形图、并列圆图和散点图

到目前为止,我们讨论的所有图表都用于分析聚合度量。然而,下一类图表在分析原始或未聚合的度量时更有益,尽管这不是它们使用的先决条件。这些图表对于检测数据中的异常值或查看两个度量之间的关系非常有用。异常值检测有助于理解异常值对统计度量(如总和和平均值)的影响程度。异常值检测在检测欺诈或错误方面也非常强大。例如,哪三位客户负责最高的个人销售?

为了查看这个,我们创建了一个销售和客户名称的圆形图。一旦我们创建了圆形图,你就会发现列板仍然显示SUM(Sales)在度量中。要移除它,你必须转到分析菜单并取消选择聚合度量

完成这些后,你会看到一个如下所示的图形:

图片

将鼠标悬停在三个候选人的圆圈上,我们发现 Sean Miller、Tamara Chand 和 Raymond Buch 拥有最高的个人销售值。考虑到 Sean Miller 的销售值是多么的异常,这也可能是数据中的潜在错误。

侧边圆形视图类似于侧边条形图,在查看未聚合数据时更有用,尽管它们也可以用于聚合数据。例如,为了找出一个物品在不同地区的价格方面的优先级如何变化,我们可以使用如下截图所示的侧边圆形图:

图片

在前面的屏幕截图中,我们可以看到,在所有市场普遍情况下,低值销售比高值销售具有更高的优先级。

散点图有助于理解度量之间的相互关系。例如,运输成本和不同产品类别销售之间的关系是什么?查看以下截图,很容易看出家具的运输成本和销售价值的变化比技术的变化要小。对于类似的销售值,技术类别的最高和最低运输成本是显而易见的:

图片

线形图

折线图是展示与时间相关的数据的最佳方式。它们将不同的数据点连接起来,以连续的方式展示,并且可以显示时间作为离散或连续实体。离散时间序列对于比较一次维度在另一个维度上的比较很有用,例如,找出哪两个季度在所有四年中的销售差异最小。快速查看离散折线图图表就能告诉我们答案是第二季度和第三季度。另一方面,连续折线图对于理解时间跨度的整体趋势很有用。例如,在下面的图表中,我们可以快速看到,无论季节变化如何,销售在四年中总体上有所增加:

图片

如果您右键单击日期,可以更改日期显示的详细程度。日期菜单将日期分为两个日期部分。第一组默认提供离散日期部分,第二组提供连续日期值,如下面的截图所示:

图片

日期部分值表示日期的各个部分,例如,如果日期是 2018 年 12 月 10 日,那么各种日期部分如下:

  • 日期:10

  • 月份:十二月

  • 年份:2018

前面的例子中的离散折线图使用了年和季度日期部分。

相反,日期值是截断到您所选级别的日期。例如,如果您有 2018 年 12 月 10 日的日期,不同级别的日期值如下:

  • 日期:2018 年 12 月 10 日

  • 月份:2018 年十二月

  • 年份:2018

前面的连续折线图使用了季度日期值,这将截断日期到季度级别。

尽管默认情况下日期部分是离散的,日期值是连续的,但我们可以使用离散和连续选项来改变这一点。关键区别在于,离散值将显示标题,而连续值在显示可视化时将显示坐标轴。

直方图

直方图用于查看连续数据的分布情况,将其分为区间或区间。它们用于确定一个度量是否为左偏斜、右偏斜或正态分布,并且在描述人口年龄分布或特定人群中财富分布等人口统计时被广泛使用。

直方图的工作方式是将整个数据集划分为区间(数据范围)。例如,如果我们想了解数量分布情况,我们会得到以下结果:

图片

2 或 3 的计数似乎是最常见的销售数量,而像 12 和 13 这样的大数则很少见。您还可以在分布中注意到,数据的平均值(3.66)位于中位数(3.18)的右侧。这种分布被称为右偏分布。这种分布的相反是左偏分布。如果左右两侧平衡,则称为正态分布。

每次创建直方图时,您都会注意到在维度面板中会出现一个新的维度,称为Quantity (Bin)。您可以通过在数据面板中右键单击它并选择编辑来编辑此 bin,如图所示:

在这里,您可以设置bins 的大小要包含的值范围、名称等。

如果任何问题询问数据的偏斜或左/右尾分布,那么您需要使用直方图。

箱线和须线图(箱线图)

当圆图表对于检测连续测量的异常值很有用时,箱线和须线图(通常简称为箱线图)对于理解连续测量的统计分布很有用,这涉及到中位数和四分位距。箱线和须线图由五个关键组成部分组成:中位数、上四分位数点、下四分位数点、上须线和下须线。中位数是数据的中点或 50^(th) 百分位数。上四分位数点和下四分位数点分别显示第一和第三四分位数。须线从四分位数点延伸到 1.5 倍的四分位距IQR),其中 IQR 是上四分位数和下四分位数的差。我们还可以将须线限制更改为延伸到图表中的最小值和最大值。

例如,APAC 中数量的四分位距是多少?

为了回答,我们使用市场和数量创建箱线和须线图。像圆图和散点图一样,您需要转到分析并取消选择聚合度量。我们得到以下图表:

对于 APAC,我们可以看到下四分位数点是 2,上四分位数点是 5,所以IQR = 5-2 = 3

上四分位数范围可以延伸到上四分位数点 1.5 倍,因此5+ (1.53) = 9.5。在数据集中低于这个值的最近的数据点是 9,因此上四分位数得到值 9。同样,下四分位数可以延伸到下四分位数点 1.5 倍,所以2-1.53 = -2.5。数据集中最接近这个值的最低数据点是 1。因此,下四分位数在 1。

记住,四分位距 (IQR) = 上四分位数点 - 下四分位数点

下须线和上须线延伸到 1.5 倍的四分位距。

甘特图

甘特图是一种流行的项目管理工具,用于跟踪活动之间的时间。图表由垂直轴上的任务或事件和水平轴上的时间间隔组成。甘特图的一个流行用途是了解项目管理计划和各种事件之间的依赖关系。另一个常见用途是了解事件之间的时间差异。

例如,一种流行的方法是查看不同运输方式以及任何其他维度(如订单类别/子类别/市场)的平均订单到发货时间。我们将以市场为例。要创建甘特图,我们需要对订单到发货时间进行计算。我们可以创建一个如下(分析 | 创建计算字段):

图片

现在,要创建甘特图,我们按以下方式设置图表:

  • 订单日期(订单日期)

  • 市场运输方式

  • 标记颜色运输方式(可选)

  • 大小Avg(订单到发货时间)

我们将其转换为平均值,因为这更有助于理解平均订单到发货时间:

图片

我们可以快速查看不同运输方式的时间。如果我们对较小的范围进行筛选,甘特图将更加有效。

组合图表

组合图表允许我们在同一视觉中查看值的组合,例如,使用折线图显示销售额总和,使用柱状图显示利润。一个著名的组合图表示例是帕累托图。

组合图表允许我们在同一轴或使用两个不同的独立轴上比较数据。创建组合图至少需要两个度量。要创建组合图,选择利润销售额订单日期,从Show Me菜单中选择双重组合。默认情况下,图表将在订单日期(年)级别创建。右键单击它,并将其更改为季度级别。您将获得以下图形,其中您将看到SUM(利润)以柱状图显示,SUM(销售额)以折线图显示:

图片

从图中,如果您不仔细关注轴,看起来SUM(利润)SUM(销售额)的刻度是相同的。然而,我们可以从轴上看出,20K的利润对应于200K的销售价值。

要同步轴,右键单击轴之一并选择同步轴。这将改变图形,如下面的截图所示:

图片

现在我们已经了解了“Show Me”菜单中可用的各种图表类型,以及如何创建它们以及它们在何时最有用,让我们来看看一些关键的属性,这些属性可以用来增强这些视觉效果。

排序您的数据

排序数据可以使模式快速可见。Tableau 允许我们进行简单的升序和降序排序、手动排序、嵌套排序以及基于某些计算的排序。我们可以对图表上显示的字段进行排序,也可以对任何其他字段进行排序。要排序数据,我们可以使用以下截图所示的任何快速排序图标:

图片

要查看每个维度的排序,请右键单击每个维度药丸。一旦点击它,您将看到按多个类别排序的选项;在这里,您可以从数据源顺序、字母顺序、手动排序、字段或嵌套中进行选择。例如,在上面的例子中,Market是使用数据源顺序:升序排序的,而Ship Mode是基于SUM(Discount)字段的嵌套排序。您可以选择任何字段和聚合,它们不必一定在图表中使用。另一种排序方法是手动将字段拖动到图中。

对于堆叠图表,可以通过移动图例来排序堆叠。在以下示例中,由于美国在颜色图例的底部,它在图表中显示为底部类别。将美国移到颜色图例的顶部也改变了它在图表中的位置:

图片

现在您已经可以创建各种图表并了解如何排序数据,让我们看看其他哪些功能可以用来增强您的数据和视觉元素。

创建过滤器、集合、组和层次结构

除了排序数据外,Tableau 还提供了许多其他方法来增强视觉元素。过滤器、集合、组和层次结构是一些重要的方法。我们将在此部分详细探讨每个方法,从过滤器开始。

过滤器

过滤是数据分析的重要组成部分。Tableau 允许我们使用维度或度量进行过滤。Tableau 中的过滤遵循以下操作顺序:

  1. 提取过滤器

  2. 数据源过滤器

  3. 上下文过滤器

  4. 维度过滤器

  5. 度量过滤器

要将过滤器应用于任何视觉元素,请将字段拖动到过滤器面板,或在图中选择要包含/排除的内容。例如,要查找标准运输模式的Market下的Profit,请将Ship Mode拖动到过滤器面板。一旦将其拖到面板上,系统会询问您如何过滤数据。这种模式因维度和度量而异。对于维度,有通用、通配符、条件和顶部等选项:

  • 通用:允许我们从列表中包含/排除,使用自定义列表或使用所有值

  • 通配符:用于模式匹配

  • 条件:基于其他字段或自定义计算进行过滤

  • 顶部:创建顶部/底部字段的子集并使用这些字段进行过滤

过滤器从左到右的选项卡进行评估,因此通用选项卡过滤器首先评估,顶部选项卡最后评估。

常规过滤器选项卡是最常用的,在这个例子中,我们将简单地从常规选项卡中选择标准类别,如以下截图所示,然后点击确定

图片

一旦点击确定,过滤器就会显示在屏幕上,并成为快速过滤器以便于访问。如果默认情况下没有显示在屏幕上,那么请右键单击维度并选择显示过滤器选项。

快速过滤器有许多选项,可以通过点击过滤器右上角的选项按钮访问,如下面的截图所示。探索各种选项以满足您的需求:

图片

另一种为任何视觉数据过滤数据的方法是选择您想在视觉中看到的数据,然后在出现的选项框中选择仅保留或排除,如下面的截图所示:

图片

集合

集合是用于定义数据子集的自定义字段。定义的子集可以是动态的或静态的,并且可以用来创建不同的视觉元素。我们还可以组合多个集合。集合的优势在于可以在所有工作表中重复使用,并且它们也会添加到数据集的元数据中。

动态集合:这些是基于某些条件而形成的集合,随着数据的变化可能会导致不同的结果。Top nBottom n集合是这种集合的常见用例。例如,总销售额中有多少百分比来自前 10 个国家?

为了解决这个问题,我们首先将创建一个销售前 10 个国家的集合。右键单击“国家”,选择创建,然后选择集合。然后在创建 | 集合下,将集合重命名为Top 10,并转到顶部选项卡。在顶部选项卡中,我们将定义集合的条件。选择按字段,并将字段更改为销售。聚合自动更改为求和。点击确定。请参考以下截图以获取步骤:

图片

您会注意到,在“集合”类别下,已创建了一个新集合:

图片

一旦将此内容放置在书架上,它将显示两个值:输入/输出——输入包括集合内所有成员的值,输出则是集合外的所有数字。要查看前 10 个国家的销售额百分比,我们现在将SUM(Sales)添加到图表中,并通过右键单击SUM(Sales)| 创建表计算 | 总百分比来创建一个快速表计算。你应该得到以下结果:

图片

这显示了 66.89%的总销售额来自仅前 10 个国家。而不是以输入/输出的形式查看值,要查看实际的集合成员,请右键单击集合并选择显示集合成员。

静态集合:这些集合具有固定的成员。例如,在前面的例子中,如果我们不是使用条件来设置前 10 个国家,而是在常规选项卡中选择美国和英国,它就会变成一个静态集合:

图片

另一种创建此类集合的方法是从视觉直接进行。选择您想要分组的值,然后选择创建 | 集合。一旦选择此选项,它将为您提供额外的选项来排除这些值或将它们添加到过滤器架中,等等。这种用法的一个例子是识别数据中的异常值,然后使用集合将它们从其他视觉中排除:

图片

分组

分组对于在常见标签下对数据进行分类非常有用。分组只是为现有数据添加了另一层标签/标题,并且只能与维度一起使用。分组的例子包括正确分类数据,例如,将纽约和纽约都归类在纽约的通用标题下,或者根据经理的领土创建区域分组。

创建分组与创建集合类似。您可以直接从视觉中创建一个分组,通过选择图表然后点击分组图标:

图片

一旦您分组了项目,您将在维度架中看到市场(分组)出现。右键点击并选择编辑分组。您将看到以下菜单:

图片

在这里,您可以一起分组其他成员,取消分组当前成员,以及重命名组,还可以选择包含一个其他组。作为一个例子,让我们通过选择非洲EMEA,点击分组,并将其命名为EMEA++来合并它们。同时,检查包含'其他'按钮并点击确定。现在,在市场(group)之后将市场拖到行架上。您将看到这里显示的图表:

图片

如您所见,各种市场类型已经根据我们在市场(group)中选择的标签分组在一起。

另一种进行分组的方法是选择我们想要分组的维度元素,右键点击并选择创建 | 分组。这将打开您在之前点击编辑分组时看到的相同菜单。

层次结构

层次结构提供了一种很好的方法来可视化高层次的复杂数据,并在需要时深入到更详细的层次。常见的层次结构例子包括日期层次结构(季度),位置层次结构(国家城市),或者产品类别产品子类别层次结构。要创建一个层次结构,请点击您想要添加到层次结构中的维度,例如,类别子类别,然后右键点击层次结构并选择创建层次结构。要向现有的层次结构中添加内容,请选择添加到层次结构

图片

一旦创建了层次结构,它就可以轻松地在图表中使用。通过使用层次结构,我们消除了使用多个视觉来表示相同数据的需要。而不是为类别子类别级别的销售数据分别创建单独的图表,层次结构允许我们在同一张表上切换两种视图。+ 图标用于展开层次结构,而- 图标用于收缩它。以下示例显示了创建的层次结构是如何展开的:

图片

现在我们已经熟悉了使用分组、集合和层次结构等功能增强视觉的各种方式,让我们将注意力转向我们快速应用以增强视觉的更多视觉格式。

格式化您的视觉

在 Tableau 中,无论是在工作表级别还是在单个图表级别,都提供了各种视觉格式化选项。

在工作表级别,可以显示三个重要的卡片:

  • 标题:显示工作表的标题。

  • 字幕:对工作表显示内容的描述,包括应用的所有筛选器细节。

  • 摘要:提供视觉的描述性统计的快速摘要,例如总和、平均值和中位数。

您可以选择显示这些中的任何一个,通过从菜单栏中选择工作表,然后选择显示标题/字幕/摘要。

在视觉级别,您可以显示/编辑以下内容:

  • 标签:显示在视觉点文本中的值。

  • 注释:带有数据突出显示点、标记或标签的注释——这些可以包含您想要显示的内容。

  • 坐标轴:坐标轴的标签名称、显示的值范围、正常或对数坐标轴——要查看坐标轴的选项,请选择并右键单击坐标轴,然后选择编辑坐标轴。

以下截图显示了标签和坐标轴:

图片

以下截图显示了注释(点和区域):

图片

要添加任何这些,我们只需在视觉上右键单击并查看可用的选项。

摘要

在本章中,我们学习了在 Tableau 中可以创建的最常见的图表类型以及何时使用哪种图表。本章还详细介绍了如何使用筛选器、集合、分组等来增强视觉并快速分析。正如本章开头提到的,Tableau 是一个视觉工具,这些理解的基本元素将大大节省时间,并有助于在考试中更快地进行分析,以及在未来创建有效且有意义的分析。

在下一章中,我们将更深入地探讨地图视觉,并了解 Tableau 中映射功能的相关内容。

第四章:可视化地理数据

几个世纪以来,地图一直被用来传达有意义的数据。我们习惯于看到地图表示我们周围常见的数据,无论是 Google Maps 计算距离,Uber 跟踪地点的成本和距离,还是天气预报查看每个地区,等等。在上一个章节中,我们了解了一些显示我菜单中可用的标准地图图表,以及我们如何使用这些图表来可视化地理数据。在本章中,我们将更深入地探讨 Tableau 的各种映射功能,并涵盖以下主题:

  • 映射基础

  • 地图导航 – 地理搜索、平移和缩放、标记选择和缩放

  • 地图功能 – 分层和自定义区域

  • 修改位置

  • 导入和管理自定义地理编码

  • 连接到空间数据

  • 使用背景截图地图

  • 创建密度地图

技术要求

本章使用以下数据集:

映射基础

Tableau 中的映射非常简单,基于可以由它们旁边的地球符号识别的地理数据字段。要创建地图,选择地理字段和任何度量,然后点击显示我窗口。如图所示,Tableau 自动突出显示符号地图作为首选的可视化:

图片

一旦点击,它将创建以下截图。如图所示,对于每个国家,符号标记位于位置的地理中心:

图片

符号地图始终在地理中心绘制标记,并且可以同时绘制两个度量。另一方面,填充地图使用地理位置来定义填充的边界,并且一次只能绘制一个度量。使用显示我菜单,如果我们现在切换到填充地图,我们可以看到以下截图:

图片

如果您的数据中没有自动检测到地理字段,请右键单击您想要显示的字段。点击地理角色 | 适当级别。例如,在下面的截图中,如果国家没有自动检测为地理字段,我们可以右键单击并选择地理角色 | 国家/地区

图片

这会将国家字段转换为地理字段,可以在符号地图填充地图中使用。符号地图填充地图的不同之处在于它们可以显示的度量数和它们如何可视化数据。除此之外,两种地图都有相同的共享常见功能和属性。从本节开始,我们将使用通用术语地图来指代它们,而不是区分它们。此处之后讨论的所有属性都适用于这两种地图视觉。现在我们已经澄清了这一点,让我们深入了解各种地图导航功能。

地图导航

当鼠标在任何地图位置上时,默认情况下会显示地图选项菜单,如下面的截图所示:

图片

如果您没有看到这些选项,请不要担心。在菜单栏上,点击地图 | 地图选项,它将显示添加到屏幕上的选项。您可以在下面的截图中看到我们只有显示地图比例尺选项未被勾选。请继续勾选它:

图片

您会注意到屏幕右下角,地图比例尺的准确性已经出现。您缩放得越近,准确性就越高。拥有易于查看的距离比例尺使我们能够查看英里、千米或您偏好的任何单位:

图片

现在,让我们详细看看每个功能。

平移和缩放

平移和缩放功能使我们能够与地图上的数据进行交互和检查。我们可以聚焦于特定位置,并移动地图以聚焦于关键信息。

缩放

可以使用放大 (+)缩小 (-)按钮来缩放地图。您也可以像通常那样使用鼠标进行缩放。或者,您可以双击放大,按住Shift双击缩小

一旦缩放,地图就会固定在视图中的该区域。要快速返回默认视图,点击重置地图图钉。例如,在下面的地图中,我们已缩放到欧洲,当我们点击重置地图时,它会带我们回到更宽的世界视图:

图片

缩放区域

要放大到图上的特定区域,还可以使用缩放区域选项。只需从工具栏中选择缩放区域按钮 ,然后突出显示你想要缩放到的区域。在以下示例中,我们使用缩放区域按钮来放大加拿大和阿拉斯加:

平移

平移选项位于缩放区域选项旁边。平移允许我们将地图移动到焦点或以我们想要的方式显示区域。要平移,只需选择平移选项,然后根据需要移动地图。或者,你可以按住Shift键并移动地图。例如,在以下地图中,位置已从默认显示移动到显示——首先显示亚洲在左侧,然后向上移动到右侧的欧洲和非洲:

对于平移/缩放,使用快捷键可以更快地导航。双击以放大,按住Shift键并双击以缩小(或者使用默认的鼠标缩放),按住Shift键并移动地图以平移。

地理搜索

地理搜索功能使我们能够快速在地图上搜索位置。例如,在我们的国家地图上,如果我们想快速查找尼日利亚,我们只需简单地使用搜索框并输入尼日利亚。当你输入时,所有相关位置的建议列表都会显示出来:

你可以在地图上搜索以下内容:

  • 大洲

  • 国家

  • 州或省

  • 城市

  • 邮编

一旦你输入/选择尼日利亚并按Enter键,地图将放大以聚焦于它。你可能注意到地图再次被固定。每次你搜索/缩放/平移时,地图都会固定在那个位置。只需点击重置按钮即可重置到默认视图。以下截图显示了搜索尼日利亚后获得的结果:

标记选择

与所有图表一样,你可以在地图上选择标记,并执行分组/集合创建等活动。除了常规的矩形选择外,地图还有两个其他选择功能,分别是径向选择套索选择

矩形选择

矩形选择是默认的选择选项。只需在屏幕上拖动鼠标进行选择:

径向选择

径向选择是地图的一个超级有用的功能。它允许我们根据圆形半径选择位置,这反过来又允许我们查看点或计算位置之间的距离:

例如,我们想要找到美国纽约市 50 英里半径内所有城市的总利润。我们首先搜索并放大到美国纽约市。然后,我们选择径向搜索。现在,保持纽约市为中心,我们将半径从美国向外扩展 50 英里。下面的屏幕截图显示了径向搜索:

如果您看不到任何距离标记,请将位置放大一些,直到它们变得可见。一旦您选择了位置,就像前面的屏幕截图所示,您可以看到所选位置的摘要,就像使用矩形选择一样。在这里,我们可以看到利润总和为 79,534:

在这个例子中,我们使用了径向选择工具来定义位于一定半径内的位置。使用相同的原理,我们可以用它来找到两个位置之间的径向距离。例如,如果我们必须搜索圣地亚哥和洛杉矶之间的径向距离,我们首先对这两个位置进行筛选,然后在两点之间创建一个径向距离搜索。选择任何城市作为中心,并将半径扩展到达到另一个城市。在下面的屏幕截图中,我们保持了洛杉矶作为中心,并将半径扩展了 110 英里,直到我们到达圣地亚哥。因此,两个位置之间的径向距离是 110 英里:

套索选择

有时候,边界选择方式不足以选择区域内的某些位置但排除其他位置。在这种情况下,套索(一种自由形状选择)是最好的选择。以下屏幕截图显示了这种选择的一个例子。在这里,我们选择了除了乔治亚州之外的所有我们想要的西部各州:

比例尺

要更改地图的比例尺,请转到地图 | 地图选项并选择显示地图比例尺选项。在这里,您可以在自动、公制系统或美国系统之间切换比例尺。一旦设置好比例尺,它们就会在地图的右下角显示出来。

仔细阅读与地图相关的任何问题中指定的单位。在执行下一步之前,您可能需要更改地图的比例尺。

地图功能 – 分层和自定义领土

现在我们已经学会了如何创建地图,让我们看看我们如何可以自定义某些地图细节,例如地图的颜色、它将显示的详细程度以及其中显示的领土。

地图图层

要查看可以添加或从地图中删除的图层或它在背景中的外观,请选择地图 | 地图图层。在 Tableau 的早期版本中,您会选择地图 | 地图选项。您将看到以下屏幕:

在这里,你可以选择和切换不同的背景:正常浅色深色。根据 Tableau 版本,你可能还有街道户外卫星背景可用:

图片

如以下截图所示,在地图层中,你可以添加你希望在地图上看到的详细信息。例如,在关注新泽西州后,地图现在显示了邮政编码、都市代码和都市边界,如以下截图所示:

图片

这些图层有助于为地图添加更深的细节层次,并允许你根据需要自定义要查看的内容。有许多地图层可用于不同地区。探索每个图层以查看你可以添加的内容。

某些地图层仅在特定缩放级别可用,如果你不在该级别,它们将显示为灰色。放大以显示更多图层。

除了更改地图背景和图层之外,Tableau 还提供了许多数据层,可用于在地图上叠加数据。要添加数据层,从数据层菜单中选择一个层。例如,为了了解美国利润是否与人们的平均年龄相关联,我们可以在图表上叠加平均年龄

创建一个显示每个利润的符号图表,并放大查看美国。在数据层下,选择以下内容:

  • 层:平均年龄

  • 按州

  • 使用:蓝绿色序列

你将看到以下图表:

图片

作为练习,添加几个数据层并更改级别以查看它们。这将使你更熟悉可用的数据层选项。

自定义领土

除了定义地图层显示的内容之外,我们还可以创建并显示你自己的自定义领土。我们可以以两种方式创建自己的领土:

  • 分组位置

  • 使用其他地理字段对字段进行地理编码

分组位置

假设你正在查看国家层面的数据,并且将欧洲大陆作为关注点。你不想逐个查看每个国家,而是希望将数据分为两个部分,即东欧和西欧。为了实现这一点,查看地图上的位置,并使用选择工具选择领土。一旦选中,点击以下截图所示的分组图标:

图片

选择组将创建这些位置的组合组。它还会在标记面板上添加一个国家 & 州分组。你现在选中的所有位置都已分组,并将以相同的颜色显示:

图片

继续按照您想要的分组方式分组地点。一旦完成分组,从颜色架上移除该字段。从维度中,将国家(分组)1拖到标记详细架上,并将利润移回颜色。例如,在下面的截图中,基于国家,创建了两个名为组 1 和组 2 的组:

截图

创建类似组的另一方法是右键点击地理字段并选择创建组。一旦创建组,将其拖到详细架上,并像使用任何其他地理字段一样使用它。

使用其他地理字段进行地理编码

创建自定义区域的另一种方法是,根据其他字段对数据中的自定义位置字段进行地理编码。

例如,我们想要将区域字段添加到位置层级中。为了实现这一点,右键点击区域字段。选择地理角色 | 从 | 国家。这样就将字段添加到了位置层级,并且旁边会出现表示地理字段的地球形状:

截图

区域字段拖到标签架上。你现在可以看到地图上显示的定制位置,如下面的截图所示:

截图

使用这种方法,您可以查看数据集中您拥有的任何自定义区域。

现在我们已经学习了如何创建地图和添加地理字段,我们将继续到下一节,在那里我们将学习如何修改地点以帮助处理错误或不明确的地点数据。

修改地点

一旦将字段定义为地理字段,Tableau 会自动检测地点的位置。有时,Tableau 会在屏幕右下角显示“x 未知”。这可能是因为位置可能不明确,即多个地点有相同的名称,或者拼写可能与 Tableau 识别的不符,例如。

修复大多数错误的最简单方法是也将其他数据字段带入地图细节中。例如,如果您只绘制城市,许多国家可能有相同的城市名称。添加国家和州可以帮助纠正此类错误。如果有地点的层次结构,Tableau 会自动使用它来消除歧义。如果在这样做之后仍然存在错误,您可以自定义编辑地点以使它们匹配。

编辑地点

要编辑地点,要么点击“x 未知”值的右下角,它将打开编辑地点窗口,要么转到地图 | 编辑地点

点击国家/地区。这将显示国家或地区是如何被检测到的。很多时候,这个字段被设置为特定国家的固定值。所以,如果你在英国,你的地图可能被设置为英国的固定字段。现在,如果你有一个包含美国各州的数据集,它将不会匹配任何位置。为了修复它,你需要编辑位置并设置固定的字段美国,或者如果你的数据集包含一个国家字段,那么将其设置为从该字段匹配。在以下示例中,你可以看到国家/地区字段映射到国家地理字段,这是好的:

图片

关闭该对话框,查看需要编辑的模糊值。你会注意到不匹配的位置被突出显示。例如,对于下诺曼底,我们知道这是诺曼底州。在未识别框中搜索诺曼底。一旦搜索并找到它,选择它。现在这将匹配位置,如下面的截图所示:

图片

如果你找不到匹配的名称,但知道位置的纬度和经度,当你输入时,你将在对话框中看到一条消息说“输入纬度和经度值”。如果你看不到这个,只需输入任何数字。一旦点击它,它将打开一个框,你可以交替输入纬度经度值,然后点击确定

一旦你映射了所有可以映射的位置,点击确定。现在如果你查看右下角,未知的数量会减少。通过这种方式,即使你有自定义位置或不同的拼写,你也可以将它们自定义匹配到适当的位置以显示在地图上。到目前为止,我们已经学习了如何修改和匹配位置,以及创建自定义地理位置。在下一节中,我们将进一步学习如何将自定义地理编码导入到 Tableau 中。

导入和管理自定义地理编码

除了为城市、州、国家、国家/地区、邮政编码、邮政编码和县等地理位置提供标准地理编码之外,Tableau 还允许我们自定义导入自己的地理编码文件。如果 Tableau 无法映射的位置,例如街道地址,或者如果我们想定义自定义地理字段等,自定义地理编码文件非常有用。

要创建自定义地理编码,我们需要一个.csv文件导入到 Tableau 中。此文件必须包含作为实数的纬度经度列,其中至少有一个小数点。除了这两列之外,其他列将取决于我们是在扩展现有角色还是添加新角色。

扩展现有角色

如果你的数据包含许多难以使用 Tableau 默认层次结构映射的位置,而不是尝试手动纠正每个错误,你只需扩展位置以包含这些缺失值即可。导入文件应包含与你要扩展的层次结构匹配的名称以及所有高于你要扩展的位置的数据。例如,如果你想扩展 映射以改进它,你需要包括 州/省国家 的列,以及 纬度经度。例如,如果我们想将以下位置添加到我们的数据中,我们首先创建一个 .csv 文件,如下所示:

要导入数据,选择 **地图 | 地理编码 | 导入自定义地理编码

选择保存您的 .csv 文件所在的文件夹并点击 导入。根据默认文件的大小和要导入的地理编码,这可能需要几分钟,然后文件将被导入。

记住,在扩展地理编码时,最高级别是 国家。没有大陆级别。然而,如果我们想将地理编码扩展到大陆级别,我们可以添加新的角色。

添加新角色

例如,如果我们想创建一个包含 大陆 作为地理字段的地理位置层次结构,我们可以创建一个简单的数据集,如下所示:

现在,点击 地图 | 导入自定义地理编码 并找到文件夹的位置。点击 导入。根据你的地理编码文件,导入文件可能需要几分钟。

现在,右键点击 大陆 | 地理角色

您将看到大陆作为一个角色出现。您可以选择将其作为 大陆 的地理类型。要创建自定义映射的地图,选择 纬度经度 字段(不是生成的字段)以及大陆字段,并使用 显示我 菜单创建地图。现在,将 大陆 字段移动到 标签,这样您就可以看到 大陆 字段上的标签。您应该得到以下地图:

如您所见,所有的大陆都绘制在我们想要的位置。除了添加地理编码外,您还可以导入自己的空间文件来绘制地图。让我们在下一节中探讨它们。

连接到空间数据

我们可以从 TopoJSON 文件、Shapefiles、MapInfo 表、GeoJSON 文件、KML 文件和 Esri 文件地理数据库连接并导入空间数据。使用这些文件,我们可以连接到点、线和多边形几何形状。目前,Tableau 不允许混合几何形状。

之前列出的每个文件来源都对包含这些文件的文件夹包含某些限制。这些限制在以下表中列出:

文件来源 文件夹中必需的文件
Esri Shapefiles .shp.shx.dbf.prj.zip
Esri 地理数据库 包含 .gdb.zip 文件或 .gdb 文件
KML 文件 .kml
TopoJSON .topojson.json
GeoJSON .geojson
MapInfo .MAP.DAT.TAB.MID,或 .MIF.ID 文件

为了说明如何使用 shapefiles 创建地图的示例,我们将使用为伦敦区域下载的文件作为示例。如果你还没有这样做,请下载 London-wards-2018.zip 文件 (data.london.gov.uk/download/statistical-gis-boundary-files-london/08d31995-dd27-423c-a987-57fe8e952990/London-wards-2018.zip) 并将其解压。

要在 Tableau 中连接文件,请转到 数据 | 新数据源 | 空间文件。定位伦敦区域 Zip 文件的提取文件夹。选择 Esri 文件夹或Mapinfo文件夹。对于本例,我们正在加载 ESRI 文件夹。它将要求你选择 shapefile。选择 london_ward.shp 文件。

一旦你导入了文件,你现在就可以创建地图了。要创建包含伦敦区域所有详细信息的地图,请点击“几何”字段。你会注意到 Tableau 已经自动将其检测为地理字段。将此字段拖到详细标记选项卡。一旦这样做,自动生成的“纬度”和“经度”标记就会出现,并创建一个图表。放大查看,你会看到以下截图中的内容。正如你在以下截图中看到的,英国伦敦的所有区域都已绘制出来:

现在,要查看每个区域的公顷数,请在详细标记中的“名称”字段中添加“公顷”字段到颜色,然后你的图表就创建完成了:

如果你想要在区域级别查看数据,请从详细标记中移除“名称”,并将“区域”添加到图表中。这样,你就可以看到区域级别的数据。你还可以通过删除任何边框来使地图更干净。点击 颜色 | 边框 | 无。这将使地图更干净,如下面的截图所示:

有时,shapefiles 只包含几何细节,但不包含你想要看到的度量;例如,如果你想检查每个区域的关于人口的数据集。不必担心。Shapefiles 作为普通文件使用,可以与任何其他文件连接,甚至是其他 shapefiles。作为一个练习,连接两个 shapefiles 并使用它们创建一个双轴地图。

在本节中,我们学习了如何导入自定义地理编码以增强地图功能。对于某些用例,即使是自定义地理编码也可能无法满足我们的需求。对于这种情况,我们可以使用背景图像来绘制我们的数据。让我们在下一节中学习如何做到这一点。

使用背景图像绘制空间数据

可能存在这样的情况,空间数据不足以在地图上准确绘制数据。在这种情况下,我们还可以使用背景图像作为背景。虽然这个选项提供了最大的灵活性来绘制,但也需要最多的努力来定义边界和点坐标。

例如,假设你想绘制你房子的平面图,并拥有以下数据:

位置 位置 ID X Y 大小
房间 3 1 15 20 100
房间 1 2 15 50 100
房间 4 3 40 20 125
房间 5 4 40 50 125
门廊 5 60 40 60

你还有这个截图:

我们将截图数据作为数据源。为了测试适当的点的位置,创建一个未聚合的度量值的散点图。对于前面的例子,绘制XY值,我们得到以下结果:

一旦你对XY点的位置满意,点击地图 | 背景图像 | 数据集。选择添加图像。浏览到你保存的平面图截图的位置,然后点击确定。添加以下截图中的详细信息:

一旦你为XY输入了限制条件,并确定了哪些字段代表XY,请转到选项并选择始终显示整个图像。点击确定。你将得到截图上的点。现在,你可以看到每个点被绘制在哪里。将标记类型更改为地图,然后添加你想要绘制的度量。现在它就像一个地图:

这种技术可以用来绘制来自任何地图的静态图像,并在其上绘制度量。

创建密度图

密度标记在 Tableau 的 2018.3 版本中被添加。这些标记为在数据重叠很多或数据浓度很高的区域寻找模式提供了另一种方式。密度标记在创建密度图中找到了它们最好的用途,这使得在空间数据中找到趋势变得超级简单。密度图与自定义地理编码文件配合使用效果最佳,因为它们允许添加详细粒度数据。在小范围内具有粒度和精确的数据,以及度量值变化的平滑性,是使用密度图的理想用例。

对于这个例子,我们将使用 311 联系电话数据集。如果你还没有下载,请在此以 .csv 格式下载:data.nola.gov/City-Administration/311-Calls-Historic-Data-2012-2018-/3iz8-nghx

现在,如果我们想了解洛杉矶地区的“邮编”分布情况,并决定绘制一个符号地图,经过多次放大后,以下截图显示了它可能的样子:

这并没有给我们提供太多信息。查看地图,看起来所有地点的呼叫几乎相等,这并不真实。在这种情况下,密度图变得非常有用。要将此截图转换为密度图,在标记菜单中,将标记类型从自动更改为密度。你会看到某些模式出现,但不是很清晰。为了增强它,拥有合适的配色方案变得很重要。点击颜色标记,并将颜色更改为密度多色浅色。一旦颜色更改,我们就可以更容易地看到模式,如下面的截图所示。你还可以在颜色菜单中进一步更改颜色的强度和透明度:

图片

你可以快速看到呼叫集中在城市中心,而较少在湖岸附近。你可以进一步过滤和比较不同问题类型,并查看它们在集中度上的差异。你还可以进一步使用页面面板来查看问题的趋势。使用页面面板时,密度是针对整个数据集计算的,因此模式可以快速相对于时间或其他因素看到。

摘要

在本章中,我们详细介绍了如何创建、导航和自定义地图。我们学习了如何确定地图的正确位置,增强地理编码,并创建我们自己的自定义地理编码和地理字段。此外,我们还涵盖了空间文件,以及它们如何被利用来为特定目的创建细微的地图。我们还探讨了向地图添加背景图像、创建自定义地图和创建密度图。

所有这些都将帮助你深入了解你可以通过地图实现的定制程度以及它们如何成为一个强大的分析工具。在下一章中,我们将从创建简单的计算开始,这些计算可以跨本章和上一章中我们学习过的各种视觉元素进行利用。

第五章:在 Tableau 中理解简单计算

在前面的章节中,你已经学习了在 Tableau 中用各种形式可视化数据。通常情况下,你想要可视化的数据可能不会直接出现在你的数据集中,但可以通过对数据集应用转换或甚至聚合数据集中的数据来轻松获得。例如,你可能有一个订单的完整地址,但你只想获取订单来自的国家或城市。或者,你可能拥有每个单独销售的详细数据,你想知道所有销售的平均值。接下来的两个章节将重点介绍计算以及如何使用这些计算来回答这样的问题。本章将介绍计算,并涵盖简单计算,而下一章将探讨更高级的计算。

本章将涵盖以下主题:

  • 计算基础

  • 创建计算并理解其组件

  • 构建算术计算

  • 构建字符串计算

  • 构建日期计算

  • 构建逻辑语句

  • 构建总计和子总计

技术要求

本章使用以下数据集:

计算基础

计算使我们能够从现有数据集中获得更多数据点,并允许我们增强我们的可视化和分析。在 Tableau 中创建计算可以使你即时分析数据,无需每次有关于如何进一步分析数据的想法时都创建额外的数据集。

何时使用计算

在我们深入探讨计算及其创建方法之前,同样重要的是要了解何时创建计算。以下是一些计算有用的例子:

  • 更改数据类型:例如,你有的数据被表示为字符串值。

  • 执行数学计算:例如,你想要将两个字段相除以获得比率或百分比,或者从字段中减去。

  • 创建逻辑分组/标签:例如,如果你想将人们分为能开车和不能开车两组,你可以创建一个计算公式说:如果你年满 18 岁并且拥有有效的驾驶执照,你就可以开车。

  • 从现有数据创建新字段:例如,你想要通过提取地址的一部分来创建国家字段,或者从一个日期字段创建新的日期字段。

  • 聚合数据:例如,你想要查看分布或国家/城市级别的销售的总和、平均值和中位数。

现在我们已经了解了何时使用计算,我们可以讨论 Tableau 中可用的三种计算类型。

计算类型

  • 简单计算:这些计算允许你在数据集的相同粒度级别(行级)或视觉粒度上聚合数据来创建新的字段。

  • 细节级别(LOD)表达式:LOD 计算是简单计算的扩展,但允许你更多地控制你正在处理的数据的粒度。你有选项来指定一个固定的粒度级别或将数据字段包含到可视化粒度中或排除它们。

  • 表计算:表计算仅在视觉的粒度级别上工作。这些计算允许你在现有数据或简单计算的基础上构建视觉级别的计算。

你需要的计算类型将取决于你问题的用例。如果你已经有了所有你想回答问题的数据,那么你需要表计算。如果你没有所有你需要的数据,但所需的数据将与数据集的粒度相同,你需要基本计算。否则,它将是一个 LOD 计算。

如果你对于计算类型有点困惑,不要担心。我们将在单独的章节中详细讲解每种类型。本章将详细讲解简单计算,而接下来的两个章节将讲解其他两种计算类型。所以,让我们看看如何创建简单计算。

创建计算

要创建一个计算,请点击分析 | 创建计算字段。或者,你可以滚动到维度/度量标签的末尾,并在那里的空白处右键单击。

你应该看到以下计算窗口:

图片

窗口的顶部,写着Calculation1的地方是你输入计算字段名称的地方。下面的空白区域是你输入计算的地方。右侧,有一个你可以使用的所有可用函数及其语法的列表,以快速帮助你。计算编辑器右侧的小三角形图标可以用来切换函数窗口的打开和关闭。

让我们创建一个非常简单的计算,看看如果平均利润增加四倍,我们的总利润会是多少,并将这个计算命名为4x 利润,如下面的截图所示:

图片

你会在计算的底部看到这样的信息:计算有效。这意味着我们现在可以点击确定,字段将被创建。如果计算无效,Tableau 中的错误检查器会快速显示错误信息,便于轻松排查问题。

一旦你点击确定,你会注意到字段出现在度量下。现在,你可以像使用任何其他度量一样使用这个计算。让我们用它来按显示结果:

图片

与之前讨论的计算一样,Tableau 中的所有计算都可以是六个基本元素的组合。以下表格描述了这些元素:

组件 描述 示例
函数 函数用于转换字段的值或成员。Tableau 中有许多类型的函数,例如 NumberStringDateUser。不同的函数有不同的语法、期望的输入/数据类型等。 在我们的示例中,AVG() 是函数的一个示例。
字段 字段代表数据源中的维度或度量(列)。 我们使用的字段是 [Profit]
操作符 操作符是表示某种操作的符号。操作符可以是以下之一:+、-、*、/、%、==、=、>、<、>=、<=、!=、<>、^、AND、OR、NOT 和 ( )。 在我们的示例中,* 是操作符。
文字表达式 这些是不变的常量值,不会改变。这些可以是数值、字符串、日期、布尔值或空值。 我们使用的文字是 4。
参数 正如我们所知,参数是动态值,可以替换文字。这些也可以用于计算。
注释 注释是您可以添加到计算字段中的简单描述。这些仅用于信息目的,不会影响实际计算。使用 // 符号添加注释。 我们没有在我们的示例中添加注释,但我们可以添加类似 // To create 4 times profit value 的内容。

使用前面提到的六个元素组合,所有计算都是创建的。现在我们更好地理解了组件,我们可以在以下部分详细查看每个组件的语法。

函数语法

在 Tableau 中有许多可用的函数类型,例如 NumberStringDateUser。不同的函数有不同的语法,并且需要不同的输入才能正常工作。您在 Tableau 中可用的所有函数列表可在计算字段窗口的侧边标签中找到。从函数列表中选择 AVG()。一旦选择任何函数,您将在帮助窗口中看到三个元素:

这些元素如下:

  • 函数的语法:对于 AVG,它显示为 AVG(expression),这意味着要获取平均值,您需要在这里写上 AVG(expression)。

  • 说明:在语法下方,是对函数功能的解释。

  • 示例:这是函数如何使用的示例。

如果您不确定如何使用函数,可以复制并粘贴示例,然后用您自己的字段替换其中的字段。这确保了语法的正确性。

您可以在计算中使用多个函数,甚至可以将它们嵌套在一起,只要它们满足语法要求。我们将在本章后面学习一些常见的函数类型。

字段语法

字段是数据中的列(也可以是计算字段)。如果字段包含空格或名称不唯一,则应始终用方括号 [] 包围。最佳实践是使用 [] 包围字段。在 Tableau 中,字段以橙色显示。您可以直接从 维度度量 选项卡将字段拖放到计算中。或者,您可以开始键入字段名称,Tableau 将显示自动完成字段的选项,如下面的截图所示:

运算符语法

运算符是表示某种操作的符号。运算符可以是以下类型:

  • 数学运算符:用于执行数学计算。运算符如下:

    • + (加法): 加法可用于加法(数值和日期字段)和字符串连接。例如,4+2 将返回 6,而 Abc + Def 将返回 AbcDef。我们还可以使用加法进行日期计算,例如,添加 #23-04-2019#+4 将给出 #27-04-2019#

    • - (减法): 减法可用于日期和数值字段的减法,与加法运算符类似。

    • *** (乘法)** 和 / (除法): 这用于乘除数值字段。

    • % (取模): 返回除法运算符的余数,例如,5%2=1

    • ^ (幂/指数): 这返回指数值,例如,2³ =8

  • 关系运算符:用于比较表达式,并返回 TRUEFALSENULL 值。每个运算符都可以用于比较数字、日期或字符串。运算符如下:

    • == 或 = (等于)

    • > (大于)

    • < (小于)

    • >= (大于或等于)

    • <= (小于或等于)

    • !=<> (不等于)

  • 逻辑运算符:逻辑运算符比较表达式的两边,并返回 TRUEFALSENULL 值。逻辑运算符如下:

    • AND: 如果表达式 1 和表达式 2 都是 TRUE,则返回 TRUE;否则,返回 FALSE。如果任一表达式为 NULL,则返回 NULLAND 的输出遵循以下规则:
表达式 1 表达式 2 输出
TRUE TRUE TRUE
TRUE FALSE/NULL FALSE/NULL
FALSE/NULL TRUE FALSE/NULL
FALSE/NULL FALSE/NULL FALSE/NULL
  • OR: OR 仅在两个表达式都是 FALSE 时返回 FALSE;否则,返回 TRUE。如果两个值都是 NULL,则返回 NULL。它遵循以下输出规则:
表达式 1 表达式 2 输出
TRUE TRUE TRUE
TRUE FALSE/NULL TRUE
FALSE/NULL TRUE TRUE
FALSE/NULL FALSE/NULL FALSE/NULL
  • NOT: NOT 用于否定其他布尔值或表达式。它遵循以下输出规则:
表达式 1 表达式 2
TRUE FALSE
FALSE TRUE

运算符的优先级顺序

运算符的评估顺序如下:

  1. (取反)

  2. ^(幂)

  3. *, /, %

  4. +,

  5. ==, >, <, >=, <=, !=

  6. NOT

  7. AND

  8. OR

要改变运算符的优先级顺序,我们可以使用最后的运算符,即括号,()。如果你把某样东西放在括号里,它将首先被执行。如果有嵌套的括号,则最内层的括号将首先执行,依此类推,例如,如果我们有以下表达式需要评估:(1+2*5) = 11 , (1+(2*5)/2) = (1+10/2) =6

字面表达式语法

字面表达式是按原样表示的常量值。字面量有以下类型:

  • 数值字面量:数字或浮点数,例如 4.22

  • 字符串字面量:常量字符串,例如 Hello

  • 日期字面量:将日期表示为常量,例如 #20-05-2019#

  • 布尔字面量:表示 TRUEFALSE 的布尔值

  • 空字面量:用于赋值或比较 NULL

参数语法

参数是简单的占位符变量。在 Tableau 中,参数以紫色表示。它们可以代表数字、浮点数、字符串、日期/日期时间值或布尔值。

注释语法

注释使用 // 表示。要添加多行注释,每行都添加 //

现在我们已经了解了构成计算字段的基本元素及其创建方法,让我们深入探讨一些计算。

构建算术计算

在 Tableau 中处理算术计算,我们可以使用上一节中讨论的运算符,使用其中许多 数字函数 之一,或者利用一些 聚合选项。本节将介绍一些重要函数,但不是完整的列表。进一步阅读部分包含到 Tableau 维护的函数 A-Z 列表的链接。

聚合选项

聚合选项定义了你的数据值是如何组合或聚合的。简单的聚合在视觉粒度级别上工作。

这意味着数据在视觉的维度级别上进行了聚合。即使不进行研究,我们在前几章创建视觉时已经使用了这种逻辑。每当我们想看到总 SUM(Sales) 时,我们只会将 SUM(Sales) 测量值带到我们的视觉窗口中。然而,如果我们想看到按段的销售,我们会在窗口中添加 Segment 维度,我们的销售将细分,如下面的截图所示:

这个原则同样适用于所有聚合操作。要查看可用的聚合级别,右键单击测量字段,选择 测量(聚合级别),它将显示其他可用的选项。例如,通过右键单击 SUM(Sales) 测量字段,以下聚合级别是可用的:

类似地,如果您想使用维度字段来表示度量值,可以将它拖入视觉中,然后右键单击并选择 度量,然后它将显示维度可用的聚合选项。

假设我们的数据集中的一个列看起来像 1, 1, 1, 2, 2, 3, 4,各种聚合选项及其结果如下:

总和 这是通过将值相加得到的度量值,计算为 = 1+1+1+2+2+3+4 = 14
平均值 这是度量值的平均值,通过将值相加除以值的计数来计算 = 14/7 = 2
中位数 这是中心值 = 2
计数 这只是简单地计算元素的数量 = 7
计数 (唯一) 这是唯一值的计数,因此不会对相同的值进行多次计数 = 4
最小值 这是最低值 = 1
最大值 这是最高值 = 4
百分位数 这显示了低于此值的值的百分比。它有进一步查看 5、10、25、50、75、90 和 95 百分位数的选项。在这里,第 25 百分位数将是 1,第 75 百分位数将是 3,依此类推。
标准差, 标准差(总体) 标准差定义了成员与平均值差异的程度。如果您有一个完整的数据集,请使用总体标准差;如果是样本,则使用标准差。标准差(总体) = 1.07
方差, 方差(总体) 方差是标准差的平方,因此根据总体或样本,我们使用方差 = 1.14 来计算此案例。

在 Tableau 中计算的聚合被发送回数据库进行查询。因此,一般规则是如果数据库不支持特定的聚合,Tableau 也不会支持它。然而,如果您创建了相同数据的提取,则聚合将得到支持。

作为练习,查看 利润 度量值和 客户名称 维度的所有聚合选项。

通过简单地使用前面聚合选项和运算符的组合,可以完成许多重要计算。例如,成本 可以确定为 [Sales]-[Profit]。然后,可以通过 AVG(Cost) 找到平均成本。

我们还可以计算 利润/销售额 比率,计算公式为 SUM(Profit)/SUM(Sales)。这将显示为小数。要将其显示为百分比,一种方法是将计算乘以 100。然而,这将不会显示 % 符号。要显示百分号,我们需要将结果格式化为百分比。为此,右键单击 度量 并选择 格式。将出现一个侧边窗口。在这里,在 默认 下,单击 数字 然后单击 百分比

您还可以通过使用自定义选项包括其他内容,例如后缀/前缀。一旦您满意,您可以关闭侧边窗口。

除了聚合和运算符的使用之外,我们还可以看看其他可用的数字函数。它们可以逻辑地分为以下类别:

三角函数:这些包括以下内容:

PI 这返回了圆周率π的数值常量,精确到 16 位小数,例如 3.141592……。PI()通常用于其他三角函数中,以指定弧度角度。
SIN 这返回一个角度的正弦值。角度必须以弧度指定,例如,SIN(-PI()/4) =-0.7071
ASIN 这返回一个数的弧度正弦值。这是 SIN 的反函数,例如,ASIN(-0.7071)=-0.7854(即 -pi/4)。
ATAN2 这接受两个坐标位置 yx 作为输入,并返回两个数的弧度反正切值,例如,ATAN2(1,1) = 0.7854 i.e pi/4
DEGREE 这将弧度转换为度,所以 DEGREE(0.7854) =45

**COS, ACOS, TAN, ATAN, 和 COT 函数与 SIN 和 ASIN 类似。|

对数和指数函数:这些包括以下内容:

EXP 这返回数字的 e 的幂,例如,EXP(2) = e²
LN 这返回数字的自然对数。对于所有零和负值,值是 null,例如,LN(2) = 0.69LN(EXP(2))=2
LOG 这返回以另一个数为底的对数值。如果没有指定底数,则返回以 100 为底的对数值,例如,LOG(1000) = 3LOG( 4,2) = 2
POWER 这返回另一个数的幂,例如,POWER (2,3) =2³= 8

其他数学函数:这些包括以下内容:

SQUARE 这返回一个数的平方,相当于 Power (number, 2),例如,SQUARE(5) = 25
SQRT 这返回一个数的平方根,相当于 Power (number, 0.5),例如,SQRT(25) =5
ABS 这返回一个数的绝对值,例如,ABS(-7) =7。当处理数量或偏差时,实际值比数字的符号更重要时,非常有用。
CEILING 这将一个数字四舍五入到最接近的整数,大于或等于该数字。这在做容量规划等问题时很有用,例如,如果你需要分配资源到项目中以完成工作,结果是3.2。如果你简单地四舍五入这个数字,你的结果将是3。但实际上你有更多的工作要做,所以有四个资源比三个更有意义,并据此进行规划,例如,CEILING(3.2) = 4
FLOOR FLOORCEILING 的反操作。它返回小于或等于给定数字的最大整数,例如,FLOOR(3.2) =3
ROUND 这将数字四舍五入到最接近的整数或指定的十进制值,例如,ROUND (3.2)=3ROUND(3.7) = 4,和 ROUND(3.1421,2) = 3.14
SIGN 这返回数字的符号,如果为正数则返回 1,如果为零则返回 0,如果为负数则返回 -1,例如,SIGN(-3)=-1SIGN(4) =1
ZN 如果表达式不是空值,则返回表达式;否则,将返回 0。这在我们要计算平均值时非常有用,既不忽略 NULL,也显示 0 而不是空值。
DIV 这返回除法操作的商,例如,DIV(7,2) =3
HEXBINX, HEXBINY 这两个函数都用于将 xy 坐标映射到最近的六边形网格。HENBINX 映射到最近的 x 坐标,而 HEXBINY 映射到最近的 y 坐标。网格的边长为 1,因此输入需要相应地缩放。

现在我们熟悉了可以用于创建数值计算的多种聚合选项和数字函数,让我们继续到下一节,我们将学习字符串计算。

构建字符串计算

与数值计算类似,存在许多字符串函数,允许进行各种计算。让我们看看一些关键字符串计算及其用法。

与从字符串中获取子字符串相关的函数

在处理字符串时,最常见的用例之一是我们只想得到字符串的一部分,而不是全部。许多函数帮助我们做到这一点。让我们看看我们可以使用哪些函数。

LEFT: 这遵循语法 LEFT (string, num_chars).

使用 LEFT,从字符串的开始返回指定的 num_chars。这对于分组非常有用。

例如,我们想根据客户名字的首字母找到订购最多的客户。我们可以创建如下计算:LEFT(Customer Name,1). 这将只返回字符串的第一个字符。然后我们可以使用这个字符并计算订单数量,清楚地看到哪个类别订购最多:

![

RIGHT: 这遵循语法 RIGHT(string, num_chars).

使用 RIGHT,从字符串的末尾返回指定的 num_chars

与第一个示例类似,如果你想找到订购人的名字中的最后一个字母,你会使用 RIGHT([Customer Name,1]).

MID: 这遵循语法 MID (string, start, [length]).

它从 string 中返回字符,从由起始值指定的位置开始。字符串的第一个字符的起始位置为 1。length 是可选的,如果指定,则返回多达那么多字符。

看看以下示例:

MID("Hello",2) = ello
MID("Hello",2,3) = ell

SPLIT: 这遵循语法 SPLIT (string, delimiter, token number).

有时候,我们不知道确切的位置来创建子字符串,但可能有一个分隔符来指定它。

例如,在我们的数据集中,我们有一个客户的完整姓名,如果我们只想获取名字怎么办?我们知道名字的格式是名字后跟空格字符,然后是中间名 + 姓氏。因此,我们的分隔符是 " "。基于分隔符,您的字符串被分割成相等的标记。

例如,如果字符串是 Alex Young,您的字符串将被分隔符分割成两个字符串。标记 1 将是 Alex,标记 2 将是 Young。因此,SPLIT("Alex Young", " ",1) 将返回 Alex,而 SPLIT ("Alex Young"," ",2) 将返回 Young。如果您使用负数,它将从字符串的右侧开始计数。因此,SPLIT("Alex Young"," ", -1) 将是 Young,而 SPLIT ("Alex Young"," ",-2) 将是 Alex

现在,回到我们的例子——如果我们想找到客户的名字,我们会创建以下计算:

图片

现在,我们统计那些以这个名字作为他们名字的人,以找到最流行的名字,如下所示:

图片

这个字符串函数的第一个逻辑子集允许我们从字符串中获取子字符串。在下一节中,我们将学习处理子字符串在字符串中位置或存在性的函数。

与在字符串中查找子字符串相关的函数

有时候,我们不想获取子字符串,只想检查某些子字符串是否存在于字符串中,甚至获取它们出现的位置。为此,以下函数很有用:

  • CONTAINS: 这个函数遵循 CONTAINS(string, substring) 语法。如果字符串包含其内的子字符串,则 CONTAINS 返回 true,例如,CONTAINS("Tableau", "Table") = TRUE。例如,为了找到有多少人的名字包含字母 E,我们可以创建以下计算:CONTAINS([Customer Name],"e") 并查看 TRUE 的计数。

  • ENDSWITH: 这个函数遵循 ENDSWITH(string, substring) 语法。如果字符串以提供的子字符串结束,则返回 true,并且忽略尾随空格,例如,ENDSWITH("hello", "lo")=TRUE

  • FIND: 这个函数遵循 FIND (string, substring, [start]) 语法。它将返回字符串在子字符串中的位置。如果指定了起始位置,则它将在起始位置之后开始搜索子字符串。例如,FIND("hello","lo") 将返回 4

  • FINDNTH: 这个函数遵循 FINDNTH(string, substring, occurrence) 语法,并返回子字符串在字符串中出现的第 n 次位置。例如,如果字符串是 abcabcabc,而我们想找到字符串中 abc 的第三次出现,我们会使用 FINDNTH("abcabcabc"."abc",3)。它将返回 7

  • STARTSWITH:这遵循STARTSWITH(string, substring)的语法,类似于ENDSWITH。如果字符串以另一个子串开头,则显示为真,例如,STARTSWITH("hello","he")=TRUE

与格式化/标准化字符串相关的函数

通常,字符串并不都遵循一致的格式。字符串中可能有前导或尾随空格,或者它们有不同的大小写。所有这些都会导致字符串被视为不同的和独立的。例如,如果有一个名为book的字符串和另一个名为BOOK的字符串,它们将被视为不同。使用以下函数,我们可以标准化我们的数据集中的字符串:

  • LOWER:这遵循LOWER(string)的语法。它将返回全部小写的字符串,例如,LOWER("Book") = book

  • UPPER:这遵循UPPER(string)的语法。它将返回全部大写的字符串,例如,UPPER("Book")= BOOK

  • TRIM:这遵循TRIM(string)的语法,并从字符串中删除前导和尾随空格,例如,TRIM("    Book    ") = Book

TRIM类似,还有LTRIMRTRIM,它们遵循相同的语法,但只从字符串的左侧或右侧删除空格。

其他重要的字符串函数

  • LEN:这遵循LEN(string)的语法。长度用于查找字符串中的字符数。它将字符串中的空格计为一个字符。例如,LEN("Hi There")是 8:Hi有 2 个字符,空格有 1 个字符,There有 5 个字符。

  • REPLACE:这遵循REPLACE(string, substring, replacement)的语法。REPLACE用于将字符串中的子串替换为替换内容,例如,在字符串中替换特殊字符,如/',例如Replace([Customer Name],"/","")

另一个例子是如果有人更改了他们的名字。你可以用新名字替换他们的名字。让我们用Aaron B替换 Aaron Bergman 的名字。创建一个新的计算,使用REPLACE如下所示:REPLACE([Customer Name], "Aaron Bergman", "Aaron B")。这个计算的结果可以在下面的屏幕截图中看到:

图片

现在我们已经熟悉了重要的字符串计算,让我们在下一节中看看日期计算。

构建日期计算

日期计算允许我们对日期执行操作,例如添加或减去日期以及获取日期的一部分。让我们在下面的部分中看看一些关键函数。

获取当前日期和时间

Today()返回 Tableau 中的当前日期,NOW()可以用来返回当前日期和时间。一个常见的用例是找到事件发生与今天之间的时间差。

获取日期的一部分

  • DAY(), MONTH()YEAR(): 它们共享函数(日期)的语法。它们分别可以用来获取日期的天、月、年部分作为整数。例如,DAY(#24-05-2019#) 返回 24

  • DATEPART: 它遵循语法 DATEPART(date_part, date, [start_of_week])。如果未提及周的开始,则根据数据源中定义的开始日确定。例如,DATEPART(week,#24-05-2019#) 返回 21

  • DATENAME: 其语法与 DATENAME 相同,即 DATEPART(date_part, date, [start_of_week])。它与 DATEPART 非常相似。关键区别在于它将以字符串的形式返回值。例如,DATENAME("month",#24-05-2019#) 返回 May

  • DATETRUNC: 其语法与 DATEPARTDATENAME 相同,如下所示:DATETRUNC(date_part, date, [start_of_week])。它允许我们不仅获取 date_part,而且截断日期到该 date_part。例如,DATETRUNC("month",#24-05-2019#) 返回 01-05-2019 00:00:00

其他日期计算

  • ISDATE: 它遵循语法 ISDATE(string)。如果字符串是日期,则返回 TRUE,否则返回 FALSE,例如,ISDATE("24-05-2019")= TRUE

  • DATEPARSE: 它遵循语法 DATEPARSE(format, string)。它用于将字符串转换为指定格式的 DATE。例如,DATEPARSE("dd-MM-yyyy","24-05-2019") 返回 24-05-2019 作为日期。

  • DATEADD: 它遵循语法 DATEADD(date_part, interval, date)。它将间隔添加到日期的指定 date_partDATEADD 是最常用的日期函数之一。

假设系统存在问题,所有捕获的订单日期都是错误的。实际上,它们比计算中显示的日期早了一个月。为了得到正确的订单日期,我们创建了一个计算 Correct Order Date 的公式,即 DATEADD("month", -1, [Order Date])。现在,如果我们把日期并排放置,我们将得到以下结果:

  • DATEDIFF: 它遵循语法 DATEDIFF(date_part, start_date, end_date, [start_of_week])。它以 date_part 的单位返回两个日期之间的差异。例如,如果我们想计算订单下单后需要多少个月才能发货,我们可以将 Shipping Time 计算为 DATEDIFF("month", [Order Date], [Ship Date])。一旦创建,如果我们查看所有运输类别的总耗时(以月为单位),我们得到以下结果:

正如你所见,同日送达超级快,所以即使将所有订单合并,运输也只花了 2 个月。另一方面,标准类别的订单运输花费了 4,489 个月。

在过去几节中,我们介绍了数字、字符串和日期计算。在下一节中,我们将专注于构建逻辑语句。逻辑语句与数字、字符串和日期一起工作,可以与我们已经学过的计算结合使用。

构建逻辑语句

逻辑函数允许你检查条件并查看它们是真是假。在接下来的几节中,我们将查看各种逻辑函数类别。

情况语句

情况语句使用以下语法:CASE <expression> WHEN <value1> THEN <return1> WHEN <value2> THEN <return2> ... ELSE <default return> END.

在情况语句中,表达式的值与每个值进行匹配,每当找到匹配时,就返回相应的返回值。如果没有值与表达式匹配,则返回默认的 else 值。如果没有默认值,则返回 null 值。

情况语句在需要将相同的表达式与多个值进行比较时非常有用。一个例子是,如果我们想要给一些市场分配数字,我们可以创建如下截图所示的计算:

图片

现在,如果我们把市场和市场编号放在一起,我们可以看到这些组:

图片

作为一项独立练习,创建一个情况语句,给每周的每一天分配一个数字。

IF 语句

IF 语句的语法如下:IF <expr> THEN <then> [ELSEIF <expr2> THEN <then2>...] [ELSE <else>] END.

使用 IF 语句,我们可以测试一系列条件,并根据条件是否为真返回值;否则,测试下一个条件。这会一直继续,直到没有条件为真,在这种情况下,表示默认条件的值;否则,它将被返回。如果没有默认条件,则返回 null。

在 IF 语句中,也可以使用ORAND运算符组合多个条件。

例如,如果我们想要将销售分为高、中、低类别,我们可以创建如下计算:

图片

在这里,你可以看到我们将任何大于 0 且小于 1,000 美元的销售归为低类别,2,000 美元及以下为中等,2,000-10,000 为高,其他所有值我们假设是潜在的错误,可能是销售值过高或低于 0,这可能是需要重新检查的。

现在,按每个销售组计算订单 ID 的数量,我们可以看到大部分订单是类别,其次是类别,只有五个潜在的错误案例,如下截图所示:

图片

作为练习,为利润范围创建类似的计算。

IIF

IIFIF 对于一个条件相似。它遵循语法:IIF(test, then, else, [unknown])。在这里,它将测试一个条件,如果条件为真,则返回 then 值;否则,返回 else 值。如果未指定 else 值,则返回 NULL,例如,IIF([Sales]>0,"Valid","Invalid")

IFNULL 和 ISNULL

IFNULLISNULL 都用于测试表达式是否为空。

IFNULL:它遵循语法:IFNULL(expr1,expr2),如果值为空,则返回表达式 1;如果不为空,则返回表达式 2。例如,IFNULL([Sales],0) 将返回 Sales 的值,如果它不是空值,否则返回 0。

ISNULLISNULL 遵循语法:ISNULL(expr)。如果表达式是 NULL,则返回 TRUE。例如,ISNULL([Sales]) 如果 Sales 是空值,将返回 true。

其他函数

除了之前讨论的函数之外,还有一些其他重要且在 Tableau 中可用的重要函数。其中之一是类型转换函数。类型转换函数对于将一种数据类型转换为另一种数据类型很有用,例如,从整数转换为字符串或从浮点数转换为整数。

所有的以下函数都遵循 Function(expression) 的通用语法:

DATE 它用于从数字、字符串或日期表达式中获取日期,例如,DATE("25/05/2019") 返回 #25-05-2019#
DATETIME DATE 非常相似,此函数返回日期和时间,例如,DATETIME("25 May 2019 13:40:00") 返回 #25-05-2019 13:40:00#
FLOAT 这用于转换为浮点数,例如,FLOAT(2)=2.000
INT 这用于将参数转换为整数,例如 INT("22")=22INT(22.2)=22
STR 这用于将值转换为字符串,例如,STR(22) 结果为字符串,22

例如,如果有数字字段 12 和另一个数字字段 22,我们想要获得连接字段 1222,我们可以将它们转换为字符串然后再转换回数字,作为 INT( (STR(12)+STR(22))) 并返回 1222 作为数字。类型转换可以在我们需要创建复杂计算并且需要某个字段的输出以正确格式作为另一个字段的输入时多次帮助。

用户函数是另一组有用的 Tableau 函数。这些函数对于创建行级筛选和安全限制在您的仪表板发布到 Tableau Online 或 Server 时可见的字段很有用。Tableau 还允许在函数如 REGEXP_MATCHREGEXP_EXTRACT 中使用一些正则表达式功能,可用于创建一些高级字符串匹配。此外,在下一章中,我们将研究一些尚未讨论的高级表格计算函数。

本章我们将讨论的最后一点将是总计和子总计以及它们如何被使用。

构建总计和子总计

除了显示计算值之外,有时我们还想在相同窗口中显示总计或子总计的值。

例如,我们有以下图表,按类别和子类别分段显示 SUM(Sales):

图片

现在,如果我们想为行和列添加子总计和总计,我们可以执行以下操作:

  1. 前往分析 > 总计

  2. 选择显示行总计 | 显示列总计。这将显示如下图表:

图片

  1. 现在,如果我们想看到子总计,我们可以从分析 | 工具中选择添加所有子总计。这将显示以下内容:

图片

如果有多个维度需要计算子总计,则可以右键单击维度以选择或取消选择,具体取决于我们是否希望计算总计。

例如,将城市添加到之前的内容中,并添加所有子总计,将创建以下图表:

图片

现在,如果我们不想在类别级别看到子总计,则可以在行架上右键单击类别,并取消选中子总计,如图下截图所示:

图片

这将移除类别级别的子总计。创建总计和子总计的另一种方法是使用分析窗口 | 总计

摘要

在本章中,我们学习了如何创建简单的计算。我们探讨了计算的各种元素所需的格式和语法要求。随后,我们详细研究了数字、字符串、日期和逻辑函数的一些重要函数和示例。最后,我们还学习了如何将总计和子总计添加到我们的计算中。在下一章中,我们将学习更高级的表格计算,我们将使用本章学到的计算结果来构建进一步的计算。

进一步阅读

要查看 Tableau 中所有可用函数的列表,请访问以下链接:help.tableau.com/current/pro/desktop/en-us/functions_all_categories.htm

第三部分:高级 Tableau

本节包括高级 Tableau 主题,如表格计算、详细程度表达式,以及 Tableau 的分析功能,例如趋势线、预测和聚类。此外,你将学习如何构建和使用仪表板。最后,你将通过与实际考试非常相似的样考试题进行实践。

本节包括以下章节:

  • 第六章,Tableau 表格计算

  • 第七章,详细程度表达式

  • 第八章,利用分析功能

  • 第九章,构建您的仪表板

第六章:Tableau 表格计算

在上一章中,我们学习了如何在 Tableau 中创建一些简单的计算。然而,有时我们可能想要使用这些计算的结果来创建新的见解。例如,在本书的这一部分,我们可以使用我们迄今为止获得的知识来创建显示客户总销售额的字段,并添加计算来显示某项产品的平均销售额,但我们不能使用客户销售额的结果来显示客户整体平均销售额。这就是表格计算发挥作用的地方,它使我们能够将先前计算的结果作为新计算的输入。

本章将涵盖以下主题:

  • 通用表格计算和背景

  • 创建快速表格计算

  • 自定义表格计算

  • 设置手动表格计算

  • 实际例子

技术要求

本章使用的是 Global Superstore 数据集,可以在www.tableau.com/sites/default/files/training/global_superstore.zip找到。

通用表格计算和背景

表格计算是一种方法,它将前几章中定义的常规计算结果,基于这些结果(而不是基础数据)进行额外的计算。

让我们以一个表格计算的例子来看SUM(Profit)Year (Order Date)的平均值(我们将在本章后面学习如何创建这样的计算):

图片

在这种情况下,平均值是通过查看聚合的标记(在这种情况下,($248,941+$307,415+$406,935+$504,166)/4 = $366,864)来计算的,而不是通过平均基础数据中的利润。

在 Tableau 中,表格计算有两个主要组成部分。第一个元素是我们想要对那些标记(在这种情况下,对标记进行直线平均)执行的计算。第二个是范围(或分区),我们将在下一节中探讨。

视图结构

Tableau 工作表视图可以分为三个主要级别,如下面的截图所示:

图片

虽然“表格”代表整个视图,但“面板”是视图的一部分,对应于行和列中维度的交叉点,由一条分隔线界定。例如,在这个例子中,有 12 个面板,因为有 4 个分隔的列部分和 3 个行部分,因此有 12 个交叉点。

最后,单元格是维度中最小的交叉点,在前面的视图中共有 180 个。在这种情况下,单元格由一个单独的标记(文本值)组成,但单元格可以包含多个标记,如下面的截图所示:

图片

让我们看看这些不同的分区如何与表格计算相互作用。

定义计算的范围

表格计算始终在特定的范围内进行计算,这通常是我们在上一节中查看的三个选项之一(表,窗格或单元格);这使 Tableau 能够知道何时以及何时在某个点上重置计算。

让我们使用之前的例子并引入Segment

图片

在这种情况下,相同的计算可以取整个表格的一个值(沿表),或在每个窗格(沿窗格)或每个单元格(沿单元格)内进行计算。

一些选项还包括一个方向:向下,横向(当你到达分区的底部或右边时将重置)或组合,例如横向然后向下(继续到下一行,而不是在当前行的末尾停止,而在范围内)。

最后,表格计算有时是相对于另一个单元格计算的。例如,如果我们正在计算百分比差异,我们必须指定哪个单元格是计算的参考。这可以在范围内,第一个或最后一个,上一个或下一个,或者对应于维度特定值的单元格(例如,相对于与 2011 年相关的值)。

总结来说,表格计算是在我们简单计算聚合结果的基础上进行的进一步计算,这些计算在一定的范围内定义。现在我们已经对表格计算有了些了解,让我们开始设置一些。

创建快速表格计算

创建表格计算的最简单方法是从快速表格计算选项开始。

每个代表度量(包括计数或维度的唯一计数)的药丸,无论是离散的还是连续的,在其自己的菜单中都包含快速表格计算选项:

图片

使用这里提供的选项之一将替换当前的聚合为表格计算,然后药丸将包含一个Δ符号来表示计算现在是表格计算。让我们看看可用的不同选项。

快速计算有不同的选项

总共有 11 个选项可以创建快速表格计算:

  • 运行总计在分区内和方向上(横向或纵向)逐步求和聚合标记。

  • 差异是标记和参考标记之间的绝对差异:(标记 - 参考标记)。

  • 百分比差异表示相对差异:(标记 - 参考标记)/ 参考标记。

  • 百分比总计显示当前标记对范围内标记总聚合的贡献。

百分比总计计算也可以通过“分析 | 百分比 | ...”打开,尽管这将影响所有度量。

  • 排名根据单元格的值对单元格进行排名(对于如何区分具有相等值的单元格有不同的选项)。

  • 百分位数表示在范围内有多少单元格的值低于当前值。

  • 移动平均计算一组先前和后续值的平均值。

最后,有四种基于时间的快速表格计算:

  • YTD(年度至今)总计是一个每年重新开始的累计总和。

  • 复合增长率计算相对于第一个值的增长率 r,以便 。这用于决定如果演变完全稳定,增长因子将会是什么。

  • 年度增长率计算与上一年度同一期间的百分比差异。

  • YTD 增长与上一年度的 YTD 总计创建一个百分比差异。

重要的一点是,YTD 计算需要一个离散的日期字段,其粒度严格小于一年(例如,年、季度、月或年、月),而年度增长率需要的是一个可以是一年或更细粒度的离散日期字段。

有可能将包含表格计算的药丸拖回数据面板,以创建基于当前表格计算定义的计算字段。通过编辑以这种方式创建的表格计算,可以帮助你理解 Tableau 在底层是如何执行计算的。

如果在任何时候你想恢复到原始计算,你可以在点击药丸时使用清除表格计算选项。

现在快速计算已经开启,让我们看看如何更改不同的参数来控制这个现成的计算。

自定义表格计算

用户在创建快速表格计算后想要做的第一件事之一是更新计算的范畴,因为默认选择并不一定是他们所想的。

适配百分比差异计算

让我们按“订单日期”的年份在行中绘制“利润”,按“订单日期”的季度在列中绘制,创建一个百分比差异的快速计算,并通过在数据面板中双击字段将其添加回视图(因为表格计算将接管原始的“利润”字段,并且不可能添加相同的计算两次):

Tableau 的默认选择是计算这个表格计算沿着表(横跨)并且相对于上一个值,这显示了季度间增长,但不是 Q4 和 Q1 之间的增长。当 Tableau 在表中运行时,它的指令只是横跨。当它无法再前进时,它将重置并从下一行重新开始。如果我们想看到相对于 2011 年第一季度的增长,我们需要执行两个动作,我们将在以下部分中探讨。

定义与分区第一行之间的百分比差异

首先,我们应该改变计算方式,使其相对于第一个值而不是上一个值。这可以通过在“相对于”选项下的药丸上右键点击来实现,如下面的截图所示:

这将使得每一行都将当前值与该行的第一个值进行比较(在这种情况下,是给定年份的 Q1)。如果我们想让它比较所有行与第一行的第一个值(即 Q1 2011)进行比较,我们可以在同一个药丸菜单中将计算使用更改为表格(向下然后向右)。

有时,“计算使用”的一些选项(例如“面板(向右)”)可能不会出现。这是因为该选项与您的当前视图不相关,可能已经被另一个选择覆盖,例如“表格(向右)”。

在这种情况下,您还可以选择“向下然后向右:”因为我们正在比较表中的第一个值,而不是上一个或下一个,所以顺序不太重要:

图片

所有计算现在都相对于 2011 年第一季度,这正是我们想要的。

使用不同的顺序

如果我们将选项更改为使用表格计算(向下然后向右)和相对于下一年,我们可能会得到截然不同的结果:

图片

因为我们是向下然后向右计算,所以我们计算了所有季度与下一年(向下计算使我们通过给定季度的年份)的百分比差异。例外情况是 2014 年第一季度至第三季度,我们将与 2011 年的下一个季度进行比较;因为给定季度没有下一年,所以我们向右移动到下一个季度的第一年。在这种情况下,我们比较的是 2014 年第一季度的$85,110 与 2011 年第二季度的$48,501。

我们必须强调,如果我们想得到有意义的成果,顺序非常重要。

您也可以从“编辑表格计算”窗口中更改这些选项,您可以通过右键单击药丸找到该窗口。

现在我们已经学会了如何创建快速表格计算,让我们看看您是否可以通过创建手动表格计算来获得更深入的理解,例如,这将使我们能够计算视图中所有标记的平均值。

设置手动表格计算

虽然您可以通过快速选项轻松创建一些表格计算,但有时现成的计算无法满足您的需求。在这种情况下,您需要创建一个手动表格计算。这是通过创建一个计算字段来完成的。

作为提醒,您可以通过以下三种方法中的任何一种创建计算字段:

  • 在菜单栏中转到“分析 | 创建计算字段…”。

  • 右键单击“数据”面板中的任何字段,并使用“创建 | 计算字段…”选项。

  • 点击“数据”面板中搜索图标旁边的箭头,靠近“维度”,并使用“创建计算字段……”。

在那里,您可以手动定义您的函数,并在计算有效后选择默认表格计算选项。让我们回顾一下用户可用的三种主要函数类型。

创建类似于快速表格计算的功能

有两个函数范围可用,它们的工作方式与一些快速选项非常相似。

第一个范围是RUNNING函数,包括RUNNING_SUMRUNNING_COUNT等。这些函数通过从第一个开始并沿着当前分区中的单元格运行,更新计算并聚合每个新单元格的结果来聚合当前分区中的单元格中的结果。虽然运行总和是最明显的例子,也是可用的快速计算之一,但有时使用另一个运行函数提供结果可能很有用。例如,RUNNING_MAX函数在跟踪记录时很有用,因为该函数将更新到计算点之前的最大数据值。

在创建表格计算时,务必在函数内部使用聚合,因为语法检查器会提醒您。

例如,如果我们想跟踪我们的记录线利润,我们可以创建Record Line Profit作为RUNNING_MAX(MAX([Profit])),并通过Year (Order Date)Quarter (Order Date)将其添加到一个视图中,以MAX(Profit)。这将显示迄今为止最大的线利润记录(截至 2011 年第二季度为 2,939 美元,然后是 2013 年第三季度的 4,630 美元,依此类推)。

第二种应该熟悉的功能类型是RANK函数,包括RANKRANK_DENSE等。正如其名称所暗示的,这些函数将根据给定的顺序(默认为降序或根据函数的第二个参数定义的升序)对单元格中的结果进行排名。以下是对不同函数如何按升序对同一组数据(10, 10, 15, 20)进行排名的快速总结:

函数 按升序对 10, 10, 15, 20 进行排名的方式 注释
RANK 1, 1, 3, 4 相同值具有相同的排名(最高)
RANK_DENSE 1, 1, 2, 3 相同值具有相同的排名(最高);没有间隔
RANK_MODIFIED 2, 2, 3, 4 相同值具有相同的排名(最低)
RANK_UNIQUE 1, 2, 3, 4 唯一排名
RANK_PERCENTILE 50, 50, 75, 100 百分位排名(等于或低于此值的值的百分比)

使用查找函数

当 Tableau 计算与上一个值的百分比差异的表格计算时,它实际上在更复杂的计算中使用一个更基础的表格计算函数。如果您想将百分比差异计算拖放到维度面板中,并稍后编辑该计算,生成的公式将类似于以下内容(为了我们的目的进行了简化):

( (SUM([Sales]) - LOOKUP(SUM([Sales]), -1) ) / LOOKUP(SUM([Sales]), -1))

在这里,我们可以看到我们正在充分利用一个名为LOOKUP(expr, offset)的函数,该函数返回给定单元格中由expr指定的计算值,更具体地说,是LOOKUP(expr, -1)来获取上一个单元格中的表达式结果。

在函数的第二部分指定偏移量以告诉 Tableau 要引用哪个单元格时,我们可以使用相对于当前单元格的简单数字相对值,负数表示之前的单元格,正数表示之后的单元格。在上一个例子中,我们使用了-1来表示前一个单元格,但它也可以是2,表示当前单元格之后的第二行单元格。如果不存在这样的单元格(因为它们会超出范围),结果将是NULL

因为这些结果可能是NULL,Tableau 通常使用一个名为ZN(expr)的函数,该函数在表达式不是NULL时返回表达式的结果,否则返回0。这在查看百分比差异公式时就是这样。

最后,我们还可以使用FIRST()LAST()来指定一个绝对位置,以指定我们想要的是当前分区中第一行或最后一行的结果。例如,LOOKUP(SUM([Sales],LAST()-1)将返回分区中倒数第二行的销售额。

定义窗口函数

在 Tableau 中,尤其是在考试中,非常有用的最后一种函数类型是Window函数。这些函数包括WINDOW_SUMWINDOW_COUNTWINDOW_AVERAGE等。这些函数都以类似的方式工作。这些函数的基本语法是WINDOW_SUM(expr, [start,end])

使用这些函数主要有两种方式。第一种是不在函数的第二部分指定startend进行计算。在这种情况下,函数将对当前分区(通过在药丸上右键单击时定义的“计算使用”选项)中所有行执行指定的聚合,例如SUM。我们将在本章末尾的第二个实际例子中使用这种技术。

此外,我们当然可以指定起始和结束位置,这将仅在所需范围内计算指定的选项。例如,WINDOW_AVG(expr,-1,1)将计算前一个、当前和下一个单元格的结果的平均值。我们刚刚为三个周期创建了一个移动平均!

LOOKUP一样,我们也可以充分利用FIRST()LAST()函数。例如,WINDOW_SUM(expr,FIRST(),0)将计算从第一个单元格到当前单元格之间所有单元格的总和。我们刚刚设置了一个滚动总和!

使用这最后一组有用的手动替代方案,我们探索创建表计算的不同选项的探索就结束了。现在让我们通过一些练习来练习我们新获得的能力。

实际例子

在结束本章之前,让我们回顾两个基于实际考试中使用的问题的快速例子。

移动平均

使用全球超级商店,截至 2012 年 6 月,排除当前月,前十二个月和后十二个月的销售额总和是多少?

要做到这一点,我们首先通过Month(Order Date)绘制SUM(Sales)。然后我们通过右键单击药丸创建一个快速移动平均表计算。

要添加如图所示Month(Order Date),可以将Order Date放入行,然后单击第二个月份选项(读取月份和年份的选项)的药丸菜单,并将药丸更改为离散(在药丸菜单中)。

默认的计算方法平均了焦点月份及其前两个月的值,但我们可以通过在药丸菜单中编辑表计算来指定我们想要计算前 12 个值和后 12 个值的总和,并取消选中当前值以将其排除在计算之外。

然后我们再次添加SUM(Sales)与计算并排:

从那里,我们可以立即看到,2012 年 6 月所需的总额为$5,481,129。

将计算放入数据面板告诉我们,我们也可以定义一个手动表计算,如下所示

WINDOW_SUM(SUM([Sales]), -12, -1) + WINDOW_SUM(SUM([Sales]), 1, 12),

这将计算前 12 个值(偏移量-12 到-1)和后 12 个值(偏移量 1 到 12)的Sales总和。

平均利润差异

使用全球超级商店,客户 Aaron Bergman 的家具订单的平均利润与任何客户/类别组合的全球最低平均利润之间有什么区别?

我们首先可以通过按CategoryCustomer进行切片来绘制平均Profit图。在这种情况下,我们想要比较这位客户在家具中的$79 平均利润与表中的最低平均利润。由于标记的数量(超过 2,000 个),如果我们仅仅使用到目前为止所学的工具,这将是一个非常困难的任务。仅仅显示MIN([Profit])并不能帮助我们,因为这只会显示单个条目的最低利润,而不是最低客户平均利润。

让我们定义最低平均利润WINDOW_MIN(AVG([Profit])),通过创建一个计算字段并将其添加到视图中。默认情况下,计算显示客户的最低值,因为计算使用设置为表(跨),这意味着计算会为每一行重新开始。将此更改为表(跨然后下)将确保计算涵盖整个表:

现在很容易计算出所需的差异是$79 - ($1,345) = $1,424。如果我们不想进行这个简单的计算,我们也可以将最低平均利润定义为AVG([Profit]) - WINDOW_MIN(AVG([Profit])),这将立即显示结果。

通过这些,我们得出结论,本章关于表计算,已经通过两个示例说明了可用的简单和更高级的选项。

摘要

在本章中,我们介绍了表计算,这使我们能够将先前计算的结果作为新计算的输入。我们学习了如何通过点击按钮创建简单计算,如何更改它们的范围和自定义它们,以及如何使用它们来创建新的更复杂的计算。在上一章学习了简单的聚合之后,本章为从 Excel 或其他 BI 工具转换而来的用户介绍了 Tableau 最令人畏惧的元素:详细程度计算。这些将在下一章中介绍,我们将学习如何利用当前视图中不可见的信息。

问题

回答以下问题以测试你对本章信息的了解。

Q: 表计算是否考虑了底层数据并可以帮助创建加权平均值?

A: 不,表计算使用先前聚合的结果作为新聚合的输入,因此表计算的平均值将直接平均范围内的结果,而不是加权平均值。例如,请参阅本章的第一部分。

Q: 快速表计算的一个选项是所有值的总和。对还是错?

A: 错误。不同的选项在章节中列出,尽管你可以使用其中一个手动“窗口”函数来实现这个结果。

Q: 在维度上也可以创建表计算。对还是错?

A: 对。你可以在维度上创建关于计数和不同计数的表计算。

进一步阅读

你可以查看以下链接以获取更多关于本章所涵盖主题的信息。

本章涵盖的内容:

第七章:细节级别表达式

在上一章中,我们介绍了表计算,当我们需要使用视图中的确切数据聚合信息时,它们非常有用,但有时我们想要使用比屏幕上可以看到的信息更多(或更少)。例如,如果您想显示客户的平均消费,您不想显示所有客户及其价值来计算平均值。这就是我们将在本章介绍的细节级别LOD)计算可以发挥作用的地方,因为它们帮助我们改变聚合级别。

本章将涵盖以下主题:

  • Tableau 的操作顺序

  • FIXED LOD 计算

  • INCLUDE LOD 计算

  • EXCLUDE LOD 计算

  • LOD 的数据源约束

技术要求

本章使用 Global Superstore 数据集,可以在 www.tableau.com/sites/default/files/training/global_superstore.zip 找到。

Tableau 的操作顺序

在深入研究 LOD 计算之前,首先重要的是理解 Tableau 的操作顺序,因为这将指导我们的讨论,了解这个新主题的适用位置。

意想不到的结果

尤其是从 Excel 或其他 BI 工具转向 Tableau 时,有时在处理 Tableau 的操作顺序时,人们会感到困惑。看似直观的并不总是反映出来。应用错误的过滤器类型或未使用适当的计算将导致无意义的结果。

以下是一个这样的场景。在 Global Superstore 数据集中,我们为 Country 创建了一个数据源过滤器,仅显示英国订单,为 State Wales 创建了一个维度过滤器,以及一个按销售额排序的前 10 名客户名称过滤器。

提醒一下,您可以通过使用过滤器窗口的Top选项来设置Top过滤器,在这种情况下选择按字段、Top 10、销售额和总和。

为什么当我们设置了 Top 10 过滤器时,结果中只有一个客户?

图片

我们将在下一节中确定为什么我们没有看到期望的前 10 名客户,使用操作顺序。

顺序

为了解释这一点,让我们看看我们在这个书中的这个阶段已经熟悉的著名操作顺序的元素:

  1. 提取过滤器

  2. 数据源过滤器

  3. 上下文过滤器

  4. 集合、条件和 Top N 过滤器

  5. 维度过滤器

  6. 数据混合

  7. 度量过滤器

  8. 总计

  9. 表计算

Tableau 中的操作按照从上到下的顺序执行。

首先,我们有数据源提取过滤器(根据使用的连接类型,是实时还是提取),如第一章构建您的数据模型中所述。这些影响工作簿级别的整个数据集,在可以应用于工作表级别的任何特定过滤器之前。就工作簿中的 Tableau 计算而言,过滤掉的数据甚至不存在。

上下文过滤器类似于数据源或提取过滤器,但它们是视图特定的。它们通常用于加快处理速度,因为它们可以进一步缩小数据范围,就像在生成视图之前创建它的临时子集一样。这些主要适用于提高在非常大的数据集中(无法在工作簿级别进行筛选)将特定于类别(例如,仅复印机销售)的视图的性能。

可以通过在过滤器面板中选择现有的维度过滤器,并点击“添加到上下文”选项来创建上下文过滤器。蓝色药丸将变成灰色,以表示该过滤器现在是一个上下文过滤器。

集合维度度量过滤器(包括条件顶级 N过滤器)在第一章构建您的数据模型和第二章使用工作表中进行了详细描述,正如第一章构建您的数据模型中描述的数据混合一样。请参考这些章节以解决对这些主题的任何剩余疑问。

根据当前的操作顺序,值得意识到的是,表格计算(如前一章所述)在顺序中排在最后,在总计(代表 Tableau 中使用的常规计算)之后。例如,如果我们在一个特定的State中对Customer Name使用排名表格计算,排名将包括该州及其订单,因为表格计算在维度过滤器之后。数据集中最大的客户可能只是特定地区的第 10 位客户。

现在我们已经了解了顺序,让我们回到之前的例子。

解释令人惊讶的结果

我们现在有了理解为什么只有一个客户出现的原因的工具:

如果我们看一下操作顺序,顶级 N 过滤器在维度过滤器(在这种情况下,对于State威尔士)之前,但在数据源过滤器(这里,Country英国)之后。

结果中显示的销售因此是威尔士地区前 10 名全国性客户(而不仅仅是威尔士地区的客户)的销售。其中九位客户在威尔士没有销售,只是在英国的其他地区,并且不出现在我们的结果中。

如果想查看仅在威尔士发生销售的顶级 10 名客户,可以将State过滤器提升为上下文过滤器,将其在操作顺序中向上移动:

现在我们已经涵盖了运算顺序,让我们深入了解 LOD 函数,这将允许我们更改聚合级别。

FIXED LOD 计算

FIXED 是本章我们将要研究的三个 LOD 计算中的第一个。它用于在电子表格中应用任何维度或测量过滤器的情况下进行计算。FIXED 的语法如下:{FIXED [dim1[, dim2]…] : 聚合表达式},其中 [dim1[, dim2]…] 是要计算的聚合维度的列表。

请注意大括号的使用。本章中我们将描述的所有三个 LOD 表达式的语法都将相同。

例如,让我们看看给定客户的首次订单日期。虽然 MIN([Date]) 计算将给出使用 客户名称 作为行或列的筛选数据集中的第一个日期,但 {FIXED [Customer ID] : MIN([Date])} 将给出每个 Customer ID 在整个数据集中的第一个日期,不考虑筛选器,对于每个客户。因此,如果我们查看 2013 年在 Global Superstore 数据集中的订单,我们会注意到 First Order Date 可以是 2011 年:

让我们现在看看这将如何受到运算顺序的影响。

运算顺序

因此,这个计算在运算顺序中的位置如下:

  1. 提取/数据源筛选器

  2. 上下文筛选器

  3. 集合、条件和高 N 过滤器,FIXED LOD 计算

  4. 维度筛选器

  5. 数据混合

  6. 测量过滤器

  7. 总计

  8. 表计算

让我们考虑三个示例来了解如何使用这个计算。

示例 1 – 终身销售价值

使用 Global Superstore 数据集,我们想要表示 2013 年我们低利润子类别的终身销售价值。

我们定义一个新的计算字段,Lifetime Sales Value,为 {FIXED [Subcategories] : SUM([Sales])}。这将计算子类别的总销售额,不考虑任何设置的维度筛选器。因此,如果我们以 2013 年的订单作为维度筛选器进行筛选,并计算 Profit Ratio(定义为 SUM([Profit]) / SUM([Sales]))、SalesLifetime Sales Value,我们将得到以下结果:

虽然 Tables 子类别在 2013 年没有盈利,销售额为 202,364 美元,但它在整个数据集中产生了 757,042 美元的销售额。

示例 2 – 贡献

使用 Global Superstore 数据集,我们想要看到在拉丁美洲市场按国家订购的单位对整个区域和整个公司的贡献。

FIXED 语法中的维度列表是可选的。因此,我们可以将 Total Quantity 定义为 {FIXED:SUM([Quantity])}。这将等同于每个计算的总单位数。这将是一个不会因我们视图的聚合级别而改变的值。

然后,我们可以将“全球数量贡献”定义为SUM([Quantity]) / ATTR([Total Quantity])(因为“总数量”不需要聚合)。

这里,我们使用ATTR,因为否则我们会因为混合聚合和非聚合而得到错误。

显示“数量”,一个针对“数量”的百分比总量的窗口计算,我们可以称之为“区域数量贡献”(沿表(向下))和刚刚定义的“全球数量贡献”,并筛选市场“LATAM”,我们得到以下结果:

图片

这里最后两列的结果不同,因为表格计算只考虑了 LATAM(因为它在操作顺序中位于维度过滤器之后)的数据,而 LOD 计算则考虑了整个数据集。

如果我们想进一步深入,我们可以将其变成一个地图视图:移除前两个度量以仅保留“全球数量贡献”,点击“显示我”>“地图”,最后选择“分析”>“显示标记标签”选项:

图片

如果我们进一步筛选国家,我们仍然会看到他们对全球市场的贡献,这与表格计算不同,表格计算只会考虑筛选后的数据集。

示例 3 – cohort 分析

使用“全球超市”数据集,我们想看看 2012 年有多少销售额是由当年首次购买(订单日期)的客户(客户 ID)产生的。这通常被称为** cohort analysis**,在考试中经常出现。

对于每个客户,我们首先必须定义他们最早的购买日期。为此,我们创建一个计算出的“首次订单日期”字段{FIXED [Customer ID] : MIN([Order Date])}。这将取整个数据集中每个Customer ID的最早Order Date

然后,我们可以创建一个以Year([Order Date])为列,Year([First Order Date])为行,SUM([Sales])为度量的可视化。这给出了以下结果:

图片

因此,在 2012 年首次下单的客户在该年花费了$128,828。

总结一下,我们使用FIXED LOD 来做出不受工作簿中应用的任何维度或度量过滤器影响的计算,这对于贡献、cohort 分析或任何需要考虑整个数据集的计算非常有用。让我们继续进行第二个 LOD 计算。

INCLUDE LOD 计算

INCLUDE LOD 计算用于添加一层聚合,它不会作为维度的一部分使用。例如,你可能想查看不同市场的平均客户终身价值。在正常情况下,你需要首先在客户级别进行聚合,然后使用该聚合的结果来计算平均值。在 SQL 世界中,我们会使用子查询。简单地平均所有销售额不会得到相同的结果,因为它将在行项目级别进行计算,因此会给出行项目的平均价值。

我们可以通过说我们想要在包含视图中的维度和另一组额外维度级别的层面上进行聚合来理解这一点。这意味着我们拥有比视图将显示的更细粒度的数据,因此我们需要进一步聚合该计算的成果以在视图中显示。虽然固定计算的结果不需要聚合,但包含语句的结果需要。

作为提醒,语法类似于固定语句:{INCLUDE [dim1[, dim 2]…] : aggregate-expression}。虽然维度在技术上是可以省略的参数,但在那种情况下使用包含函数没有好处,它只是计算通常的聚合,没有增加粒度。

对于固定,在继续举例之前,了解它在运算顺序中的位置以优化其使用是很重要的。

运算顺序

这个特定的 LOD 函数,以及随后将出现的排除LOD 计算,位于数据混合和度量过滤器之间。因此,它们的计算晚于固定计算:

  1. 提取/数据源过滤器

  2. 上下文过滤器

  3. 集合、条件、Top N 过滤器,固定LOD 计算

  4. 维度过滤器

  5. 数据混合

  6. 包含排除LOD 计算

  7. 度量过滤器

  8. 总计

  9. 表计算

示例 1 – 客户平均终身价值

使用全球超市数据集,对于技术类别,我们想查看按SegmentMarket拆分的客户平均终身销售价值。

如果我们只计算直接的AVG([Sales]),我们会得到以下结果:

图片

然而,这代表的是客户在行项目级别的平均销售额,而不是终身价值。如果客户 A 有两个订单,金额分别是 100 美元和 200 美元,而客户 B 有一个 300 美元的销售,平均销售额是 200 美元,但平均终身销售价值是 300 美元,因为两位客户的终身价值都是 300 美元。在这里,我们首先需要在客户级别计算销售额,然后对结果进行平均。

视图中缺少的维度是客户名称。因此,我们将创建一个包含语句{INCLUDE [Customer Name]:SUM([Sales])},这将创建一个客户级别的中间计算。然后可以使用AVG对这些计算结果进行聚合,以得到正确的结果:

图片

值得注意的是,如果我们总是要计算客户的终身销售价值平均值,我们可以在计算字段内的AVG中包含包含语句,Tableau 将识别如何进行聚合,而无需每次都指定它:AVG({INCLUDE [Customer Name]:SUM([Sales])})

示例 2 – 客户平均发货天数的中位数

全球超市公司担心一些订单发货延迟,以及这可能会对其客户产生的影响。让我们看看 平均发货天数 通过 客户名称 对延迟订单的分析。

如果在工作簿中尚未定义,平均发货天数 计算为 DATEDIFF('day',[订单日期],[发货日期]),而 发货状态IF [实际发货天数] > [计划发货天数] THEN "发货延迟"

ELSEIF [实际发货天数] = [计划发货天数] THEN "按时发货"

ELSE "提前发货" END.

如前几章所见,我们可以通过 细分市场 创建一个快速分布图,使用 客户名称 作为详细标记以查看每个客户,并筛选出 发货状态 为发货延迟的订单:

图片

虽然有时查看每个客户是有价值的,但每个象限的概览数字可以是一个良好的性能指标。让我们选择中间值作为这样一个指标。我们现在需要移除 客户名称 作为维度,但仍然在计算中保留它以找到中间值。

在这里,我们可以定义 MEDIAN({INCLUDE [客户名称] : AVG([实际发货天数])}).

让我们从右边开始分解这个公式。看看平均发货天数。视图包括 细分地区,所以通常的聚合会在那个级别进行。然而,我们希望在客户级别进行计算,因此我们创建了一个 INCLUDE 语句,指定我们想要将 客户名称 添加到维度列表中,即使它不是我们视图的一部分。由于现在结果过于详细,无法在视图中显示,我们选择最终通过取这些结果的中间值来进行聚合。如果我们通过 细分市场 创建一个快速视图来查看这个度量,使用度量值作为颜色和分析 > 显示标记标签选项,我们得到以下结果:

图片

总结来说,我们可以使用 INCLUDE LOD 首先聚合一个高于视图级别的级别,包括一些不在其中但我们可以将其聚合回视图级别的维度。这在尝试从项目级别数据的集合中提取和总结订单级别数据时很有用。在结束这一章之前,让我们研究一个最后的 LOD 计算示例。

EXCLUDE LOD 计算示例

虽然 INCLUDE LOD 计算使我们能够沿着视图维度和指定的进一步维度进行计算,但 EXCLUDE LOD 计算允许用户在计算时省略视图中使用的一个维度。例如,我们可以使用 EXCLUDE 来计算一个类别在各个地区的总利润,即使 地区 被用作行。这在处理对总量的贡献时特别有用。

示例 1 – 对总量的贡献

使用 Global Superstore 数据集,我们希望显示欧盟市场南部地区的总利润贡献,按国家、类别和子类别切割。意大利紧固件子类别对南部整体紧固件业务的贡献是什么?

我们可以先在南方按CountrySub-category绘制利润,并添加总计:

图片

在意大利的紧固件情况下,我们希望看到它代表了利润的 $578/$898 = 64%。

我们有两种计算这种贡献的方法。我们可以为SUM(Profit)添加一个快速表格计算,计算总百分比,计算沿表(跨)进行。

我们还可以使用一个 LOD,计算子类别的总利润为{EXCLUDE [Country]: Sum([Profit])},这将消除对Country的依赖,但不会对Sub-category产生影响。因此,我们可以进一步定义SUM([Profit]) / ATTR({EXCLUDE [Country]: Sum([Profit])})为一个国家对整个地区的贡献:

图片

如预期的那样,这两个计算产生了相同的结果。我们也可以向上汇总到类别或向下钻取到产品名称,而无需重新定义字段。无论我们如何切割数据,我们都会始终显示对整个地区的贡献。

这两个计算之间的唯一区别在于运算顺序。虽然EXCLUDE LOD 计算在度量过滤器之前,但表格计算在之后。因此,如果我们根据度量进行筛选,表格计算将仅反映表中的值,而EXCLUDE LOD 计算将继续显示相同的结果。

例如,如果我们根据SUM(Profit)筛选,只显示盈利的四象限(即SUM(Profit) > 0),我们得到以下结果:

图片

我们可以看到,EXCLUDE LOD 计算没有变化,而Table Calc现在仅反映屏幕上显示的数据。

示例 2 – 平均利润差异

使用 Global Superstore 数据集,对于盈利订单,我们想知道按类别和市场划分的平均每行利润与整个类别的平均利润之间的差异。例如,非洲的办公用品订单的平均利润与非洲任何订单的平均利润之间的差异是多少?

我们首先定义Order Profitable?IF {FIXED [Order ID]:SUM([Profit])} > 0 THEN 'Profitable' ELSE 'Not Profitable' END,这将计算每个 Order ID 的整体利润,并快速筛选。

然后,我们可以按CategoryMarket切割平均Profit,筛选盈利订单,开启行的大总计:

图片

在这种情况下,我们希望比较办公用品的$25 平均利润与非洲订单的$50 平均利润。

因此,我们可以定义 {Exclude [Category]: AVG([Profit])} 为排除 Category 维度的平均利润(在这个视图中等于给定市场的 总计),以及进一步的计算 AVG([Profit]) - ATTR({EXCLUDE [Category]: AVG([Profit])}) 将显示所需差异:

在这个例子中,我们可以看到非洲办公用品的订单比这个市场的平均订单行利润低 $25。再次强调,我们可以更改维度,而无需更改我们字段的定义,例如通过 Segment,只要我们继续按 Category 进行切片:

然而,如果我们完全删除 Category,这个计算将与简单的 AVG([Profit]) 没有区别,并且会失去其价值。

LOD 的数据源限制

虽然在 Tableau 中通常支持 LOD 计算,但某些数据源类型有一些限制。在撰写本文时,以下是一些最显著的例外:

数据源 支持
Google Big Query 支持标准 SQL,不支持旧版 SQL
Microsoft Access 不支持
基于 Microsoft Jet 的连接(Microsoft Excel、Microsoft Access 和文本的旧版连接器) 不支持
Microsoft SQL Server SQL Server 2005 及以上
Mongo DB 不支持
Oracle 支持版本 9i 及以上
PostgreSQL 支持版本 7 及以上

完整且最新的版本列表可以在 help.tableau.com/current/pro/desktop/en-us/calculations_calculatedfields_lod_constraints.htm 找到。

摘要

在本章中,我们介绍了 Tableau 中可用的三种 LOD 表达式类型(FIXEDINCLUDEEXCLUDE),并研究了如何使用它们在比视图中的维度更细粒度(在 INCLUDE 的情况下)或更粗粒度(在 EXCLUDE 的情况下)的级别上聚合数据。我们还探讨了运算顺序,以解释这些计算与之前看到的计算(如表计算)之间的差异。例如,我们现在拥有计算对总贡献的工具、基于首次订单日期创建队列的工具,以及从项目级数据开始聚合客户级信息的工具。

这里是一个快速提醒:

FIXED INCLUDE EXCLUDE
运算顺序 在维度过滤器之前 在维度过滤器之后 在维度过滤器之后
目的 沿选定的维度在整个数据集上计算 使用不属于视图的维度计算结果 排除视图中的一个维度计算结果

本章结束了我们对 Tableau 中可以使用的不同计算的三个章节的探索之旅,我们现在准备使用一些分析工具来为我们的工作表添加一些见解。

问题

回答以下问题以测试你对本章信息的了解。

Q: 如果我没有使用任何维度过滤器,使用“总百分比”表格计算和使用FIXED/EXCLUDE计算之间有区别吗?

A: 虽然它们在一般情况下会产生相同的结果,但本章中我们讨论了一些例外情况,差异的主要原因是操作顺序。FIXED计算将不受维度和度量过滤器的影响而保持不变,EXCLUDE计算将不受度量过滤器的影响(但不受维度过滤器的影响),而表格计算将受维度和度量过滤器的影响。

Q: LOD 计算必须使用视图中已经包含的字段吗?LOD 计算能否在视图中选择字段确定的级别之外进行聚合?

A: 如INCLUDE计算的示例所示,LOD 计算可以用于对视图中不存在的字段进行聚合。

Q: LOD 计算总是产生度量值吗?

A: 不一定。在本章第二部分的群体示例中,我们可以使用FIXED LOD 计算来创建一个首次购买日期,这将被视为一个维度。

进一步阅读

你可以查看以下链接以获取有关本章涵盖主题的更多信息:

第八章:利用分析能力

在前三个章节中,我们学习了如何在 Tableau 中创建越来越复杂的计算。现在我们有了开发强大工作簿的工具,让我们看看是否可以利用 Tableau 的分析能力为我们的数据增添色彩,无论是通过图形元素,如参考线或带状区域,还是使用预测来预测未来的数据。

本章将涵盖以下主题:

  • Tableau 分析面板中的基本工具

  • 额外的分析选项

  • 使用预测

  • 实际例子

技术要求

本章使用 Global Superstore 数据集,可以在www.tableau.com/sites/default/files/training/global_superstore.zip找到。

Tableau 分析面板中的基本工具

Tableau 提供了一套现成的分析工具,可以简单地拖放到视图中。这些功能可以在分析面板中找到,通常通过点击数据旁边的标签页:

图片

如果你看不到屏幕左侧的内容,你可以通过菜单栏中的 Window > Show Side Bar 来显示它。面板包含的工具被分为三个部分:总结、模型和自定义。

使用选项

工具栏中的每个分析工具都按相同的方式工作。你可以双击选项,或者将其中一个拖放到视图中,这将出现一个包含几个选项的面板:

图片

通常情况下,它将显示三个图标(表格、面板和单元格)或只有一个(当没有选择时),除了总计。这将向 Tableau 指示计算应考虑的范围,并且你可以在其中一个图标上放置你的分析工具。以平均行选项为例,将其拖放到每个图标上会产生以下三种可能性:

如果你选择了表格图标,你将得到以下输出:

图片

如果你选择了面板图标,你将得到以下输出:

图片

如果你选择了单元格选项,你将得到以下输出:

图片

虽然表格代表整个视图,但面板是视图的一部分,对应于行和列的维度交叉,这些行和列由一条分隔线界定。例如,在前面的例子中,有两个面板,一个在 APAC 下面,一个在 LATAM 下面,正如你所看到的它们之间有一条线。单元格是维度最小的交叉点,在先前的视图中共有八个。

这些是我们之前在第六章,Tableau 表格计算中讨论过的选项。

我们也可以通过说表格选项类似于总计数,将在整个可视化中只保留一个值;面板选项类似于一个维度的子总计;单元格选项类似于最低级别的子总计,并且只有在有详细标记的情况下才有意义(否则,它将只聚合一个值,就像这里的情况一样)。

一旦这些分析工具被集成到视图中,您可以通过单击它们的表示并使用工具提示中的相关选项来编辑或删除它们:

图片

您也可以通过简单地拖动并放下参考线使其不可见来执行删除操作,就像您对任何其他字段所做的那样。

最后,您可以使用新创建的线条或区域上的格式选项,包括颜色、字体和数字格式。

大多数工具实际上只是对自定义选项的快捷方式,所以让我们首先浏览一下那些选项。

创建参考线

不同的线条选项将在您选择的范围内(无论是表格、面板还是单元格级别)创建参考线。一旦将参考线选项拖放到您的可视化中,您就可以使用编辑窗口在两个主要值类别之间切换:

图片

在这里,您可以选择“常量”选项,它将在您的表示中显示一条单线,或者选择几个计算选项之一,这些选项将在您选择的范围内聚合值。不同的聚合可能性显示在“线条”子菜单下,包括“常量”选项。

参考线相当于表格计算,这意味着显示的平均值将是可视化中标记的平均值,而不是底层数据。

最后,您还可以选择置信区间并在同一线条子菜单和线条标签下显示它,标签可以自定义(无论是显示值、聚合名称还是计算名称,分别使用值、计算和自定义选项)。

您也可以通过单击现有的参考线并使用工具提示中的编辑选项来返回此菜单。

分析栏中的快捷键

分析工具栏中的常量线、平均线、带有 95%置信区间的平均线和带有 95%置信区间的中位数选项是线条最常见选项的快捷方式,但您始终可以将它们拖放到视图中并在以后进行编辑。

使用参考带

参考带将创建两条参考线,正如前一小节所述,并将用浅色填充这两条线之间的空间。编辑窗口中的“带来源”和“带目标”选项与线条相同;您可以使用这些选项来自定义和格式化带的上下值。

分析栏中的快捷键

在分析栏中没有常用参考带的快捷键;您必须在自定义下的“参考带”选项中,选择相关参数。

添加分布带

分布带允许用户创建一个或多个前一个聚合的倍数(例如,中位数的 50%、100%或 150%)的带状区域,或者基于统计量(例如,百分位数、分位数和标准差)创建线条或带状区域。生成的带状区域将以所选主要颜色的不同色调着色,以表示两个度量之间的间隔:

图片

当在编辑窗口中使用百分位数时,用户可以选择使用所选值之一(80、90、95、99)来显示相应的百分位数线,或者使用“输入一个或多个值”选项:

图片

例如,要显示第 20、60 和 90 个百分位数,请从下拉菜单中选择“输入一个或多个值”,并输入百分位数作为逗号分隔的值;例如,20,60,90

如果您想为给定的百分位数(例如,第 90 个百分位数)创建参考线,您必须使用带有“百分位数”选项的分布选项卡,使用一个值,而不是使用线条选项卡,因为那里没有百分位数选项。

对于分位数,可以使用介于 3(三分位数)和 10(十分位数)之间的任何值,但默认情况下,所有分位数都会在视图中显示。如果您只想显示几个选定的分位数,请使用带有选定计算值的百分位数选项(例如,10,50,90仅显示第一、第五和第九十分位数)。

标准差选项创建的是与平均值相距标准差倍数的带状区域。虽然最常见的选项是-1,1以显示平均值的正负一个标准差内的分布(一个在下方,一个在上方),但可以指定更复杂的带状区域,例如-0.5,1,2,以显示从平均值的 0.5 个标准差以下到 1 个标准差以上的带状区域,以及一个从 1 到 2 个标准差以上,以不同色调显示的第二个带状区域。

分析栏中的快捷键

分析工具栏中的“中位数与四分位数”选项是常见参考带(四分位数,4 度分位数)的快捷方式,但您可以将“分布带”选项拖放到可视化中,以创建数据的自定义视图。

生成箱线图

箱线图(也称为箱线和须线)是目前最广泛使用的统计可视化之一。箱体表示四分位数范围(或IQR,即第一四分位数和第三四分位数之间的分布范围,也称为枢纽),用线表示中位数,而须线则表示数据的全部范围或四分位数范围的 1.5 倍。

这是一个非常有用的工具,用于描述您不想推断正态分布时的变化。

可以通过从分析面板拖动或使用“显示我”按钮来创建一个箱线图可视化:

如果工具箱中的箱线图选项变灰,将其悬停在其上会显示当前视图的问题(例如,视图中的标记不足或不能与条形图等堆叠标记混合)。

将鼠标悬停在箱线图上,将显示箱线不同极限的值,从底部开始:下须须、下枢纽(第一四分位数)、中位数、上枢纽(第三四分位数)和上须须。

使用工具提示中的编辑功能,通常会将您带到编辑窗口,在那里您可以格式化箱线并更改以下两个选项:

  • 检查须须是否应该延伸到 1.5 倍四分位距内的数据或数据的最大范围

  • 是否显示或隐藏不在须须之外的标记(异常值),使用“隐藏基础标记(除异常值外)”选项

现在我们已经介绍了基本的分析工具,您可以看到它们实际上是四种将在编辑参考线、带或箱窗口顶部可用的可视化类型:

将其中之一添加到视图中,您只需转到编辑框即可创建它们。我们将在下一节继续回顾剩余的不同工具。

其他分析选项

分析面板中剩余四个选项是:总计趋势线聚类预测。这些中的最后将在下一节中详细介绍,让我们先关注前三个。

总计

总计选项可以拖放到视图中,以打开所有行、所有列的总计,或为所有行和列添加子总计:

无法为选定的维度打开子总计;必须对所有或没有进行操作。

总计也可以通过使用分析>总计选项来打开,这些选项可以在菜单中找到。

趋势线

Tableau 可以使用分析栏中具有相同名称的选项创建常用的趋势线(线性、对数、指数、多项式、幂),并通过拖放将其拖放到视图中:

如果趋势线选项在侧边栏中不可用,这通常是因为您需要两个轴都是度量值,或者是一个日期和一个度量值。当鼠标悬停在灰色选项上时,将会显示这一点。

例如,使用全球超市数据集,我们可以将“利润”添加到行,将“销售额”添加到列,将“订单 ID”添加到详细标记,并筛选出“订单利润是否为利润”为利润的订单。然后,我们可以将趋势线拖放到可视化中的线性图标上。通过这样做,我们将得到以下输出:

将鼠标悬停在线上将显示带有方程式和 R²和 P 值的工具提示,这将帮助你确定趋势是否相关。

如果你需要编辑趋势线或更改参数,你可以在工具提示中选择编辑选项,进入趋势线选项窗口。

现在,凭借 Tableau 的力量,只需几点击就能轻松识别趋势。

虽然选项没有明确包含在考试大纲中,但当我们想要创建数据集的子集时,它是一个有价值的工具。例如,我们可以通过在行中包含国家来创建一个地图视图,将SUM(Sales)作为指标,并使用“显示我”选项创建快速地图。然后,将簇拖到视图中将根据销售价值水平生成国家组,并使用它们对地图进行着色编码。如果我们想修改这些参数,我们可以在指标中的簇药丸上单击并选择编辑簇:

图片

然后,我们可以添加其他变量以包含在簇的计算中,并且我们可以定义一个固定的簇数,而不是保持自动化的数量。

有关 Tableau 如何创建簇的更多信息,请参阅本章“进一步阅读”部分的如何进行聚类链接。

当创建了一个簇时,你可以将其药丸从指标部分拖动到维度,将其转换为一个组。你会注意到图标与通常的组图标略有不同(簇图标和回形针的组合),这是为了表示这个组不是静态的,可以使用重置选项进行重新拟合。这意味着如果范围发生变化,它可以更新为最新的数据。

摘要卡片

虽然摘要卡片不是分析面板的一部分,但如果你想要快速查看数据集的统计属性,它是一个有用的工具。

它可以通过使用工作表>菜单中的显示摘要来打开。当它们显示时,它将出现在卡片部分,位于过滤器下方:

图片

默认情况下,它将显示每个度量指标的总分以及总和、平均数、最小值、最大值和中位数。当在卡片中的下拉菜单中选择时,你可以选择额外的计算集,包括标准差、第一四分位数和第三四分位数。

重要的是要记住,这张卡片中的结果类似于表格计算:这里显示的中位数是指标的中间值,而不是基础数据的中间值。

这总结了我们对 Tableau 附带的基本分析工具的回顾。还有一个工具要回顾,我们将在下一节中完成。

使用预测

虽然之前的工具仅对现有数据进行分析,但预测选项允许我们外推数据,以便窥视未来。

默认情况下,Tableau 包含一个包含几种模型最佳选择的包,以创建一个简单的预测。Tableau 使用指数平滑模型,该模型对最近的数据点赋予比旧数据点更多的权重。然后可以使用在编辑预测工具箱中找到的选项对这些预测进行微调。

要开始使用预测,只需将分析栏中的预测选项拖放到包含一个且仅有一个日期字段的图表或表格上(否则,你将看到一条消息,表明无法为具有多个日期字段的视图创建预测)。你还可以使用分析 > 预测 > 显示预测菜单来达到相同的结果。Tableau 将然后创建一个基于自动选项的最佳猜测预测,包括给定时期的置信区间(基于可用过去数据量)。

例如,使用 Order Date 作为列(月份)和 Sales 作为行,我们可以将预测选项拖放到视图中:

图片

这将创建一个新的颜色方案,以便我们可以区分实际数据和估计数据,并且旁边将出现一个粗箭头,以确认预测已开启。如果你需要编辑预测,可以在点击预测时使用工具提示中的编辑功能,或者使用分析 > 预测 > 预测选项...菜单。

对于此功能的基本用户和本考试的用途,唯一可能感兴趣的选择是预测长度(如果你想要能够操作它)和忽略最后选项,这在某些数据后面有未完整周期时很有帮助。高级用户可以使用了解更多关于预测选项的链接,以深入了解不同选项可以带来什么。

如果你遇到无法添加预测(或预测未显示)的问题,可以在分析面板中的预测选项上(或视图中的无预测标签上)悬停,以了解更多关于为什么无法生成预测的原因。

这结束了我们对 Tableau 提供的不同分析工具的回顾。在我们结束这一章之前,让我们看看一个例子。

一个实际例子

现在我们已经了解了 Tableau 的分析工具,让我们看看我们是否可以解决这个样本考试问题:

在拉美市场中,哪些子类别在销售额和利润方面都偏离平均值超过一个标准差?

我们可以通过两种方式来回答这个问题。

首先,我们可以使用上一章中的内容,使用 INCLUDE 语句来显示两个度量总和的平均值和标准差。在这里,我们将定义 {INCLUDE [Sub-Category]: SUM([Profit])}{INCLUDE [Sub-Category]: SUM([Sales])} 并查看每个的平均值和标准差,如下所示:

图片

通过进行一些简单的加法,我们可以得到下限和上限(例如,$13,038 + $14,161 = $27,199 作为利润的上限,$127,330-$111,886 = $15,444 作为销售额的下限)。随后,我们可以按Sub-category绘制SalesProfit,并得到答案。但在向下扫描时,很容易忽略一个子类别。

相反,我们可以尝试充分利用分析面板。我们可以将SalesProfit绘制在行和列上,并使用Sub-Category作为详细标记:

图片

现在,我们可以将分布带拖放到表的两个度量上。而不是默认的 60%,80%的平均值,我们可以点击标准差并保留建议的-1,1 因子,这意味着平均数上下各一个标准差:

图片

注意,你可能需要调整其中一个带,因为 Tableau 一次处理一个,第二个仍然会显示默认的 60%,80%的平均值。为此,单击带的一个定义线,并在工具提示中使用编辑。

现在,我们有一个表示平均数一个标准差内的分布的阴影区域:

图片

因此,很容易在右上角找到三个子类别,它们位于两者之外,并且可以通过悬停在标记上(如果需要的话,在椅子上、电话和复印机上)来获取它们的名称。

摘要

在本章中,我们介绍了 Tableau 的一些分析工具,这些工具允许我们创建参考线或带,将数据聚类在类似的桶中,识别趋势,并预测我们的数据将如何在未来看起来。这使我们能够突出一些可能从视图中遗漏的有用信息(例如平均线或可能告诉我们项目何时开始和结束的恒定带),这有助于将有意义的见解带入我们的数据。

本章结束了我们对工作表的探索,我们现在已经拥有了所有考试所需的工具。在本书的下一章和最后一章中,我们将研究如何使用仪表板将不同的工作表链接并呈现为单个综合视图。

问题

回答以下问题以测试你对本章信息的了解。

Q:使用全球超级商店数据集,如果你通过Year创建Sales的预测,Tableau 默认预测多少个周期?

A:两个周期(以Year(Order Date)作为列,以SUM(Sales)作为行,并拖动预测选项)。

Q:如何在视图中创建 90 百分位数的单行?

A:通过添加一个带有百分位数的分布带,选择 90 作为选项,而不是添加参考线,因为没有百分位数的选项。

Q:使用全球超级商店数据集,使用四分位距,中亚哪个国家的利润分布最广?

A: 如本章所述创建箱线图,印度是拥有最宽四分位距(由箱体大小表示)的国家。

进一步阅读

您可以通过以下链接查看更多关于本章所涵盖主题的信息:

第九章:构建您的仪表板

到目前为止,我们已经学到了很多关于如何构建数据视图的知识;现在是时候将所有这些整合在一起了。您创建的视图通常是用户识别关键信息的手段。仪表板允许我们将多个视图组合到单页面上。通过在单页面上展示多个数据视图,我们能够更有效地传达信息。

然而,在单页面上展示多个视图带来了许多挑战。你需要展示合适的视图组合,而不会让用户感到不知所措。你还需要以用户易于使用和理解的方式构建仪表板。本章将向您介绍功能和最佳实践,这些将帮助您构建可操作和富有信息量的仪表板。在本章的最后部分,我们将讨论以下主题:

  • 仪表板简介

  • 有效的设计实践

  • 探索仪表板和布局面板

  • 讲述故事

  • 整合一切

仪表板简介

仪表板是单页面上重要信息的视觉展示。它通常由多个相关组件组成,允许用户跟踪变化或获取信息。仪表板内置了控制功能,允许用户过滤信息。这些过滤器通常控制仪表板上的多个工作表。这使得用户能够在不切换屏幕的情况下查看各种相关组件。

过滤器是用户与仪表板中视图交互的方式——它们允许用户回答问题。仪表板与报告的区别在于仪表板主要是视觉化的。虽然它们可以包含表格摘要,但应该强调可视化。已有许多研究描述了数据可视化的重要性。主要发现是数据可视化在揭示模式、异常值、趋势和相关性方面表现出色,这些在查看数字表格时难以发现。

您可以将仪表板视为选择如何展示您的表格。仪表板应该能够传达数据中的关键发现。构成仪表板的可视化通过过滤器和控制功能是交互式的。有效的信息设计既是艺术也是科学。没有一种适合所有情况的通用方法或技术来创建强大而有用的仪表板。

如果经过深思熟虑,仪表板可以为组织带来巨大的价值。在下一节中,我们将讨论如何创建有助于用户更好地理解数据的仪表板。

有效的设计实践

当你准备创建仪表板时,你已经做了大量的工作来创建表格。表格是仪表板的基础;不仅要在开发单个表格时小心,还要注意它们在仪表板中的呈现方式。在本节中,我们将讨论有效仪表板设计的最佳实践。虽然这些提示并不全面,但它们将为你开发强大仪表板的道路提供一个良好的起点。

目的

在构建任何解决方案之前,最重要的考虑因素是了解目的。仪表板将回答哪些问题?有一个要回答的具体问题列表可以给你一个明确的目的。在开发仪表板时,你应该始终有一个明确定义的目的。了解目的迫使你解决观众的需求。在商业中,了解仪表板的目的通常涉及理解用户对哪些关键绩效指标KPIs)感兴趣。

通过了解你的受众并理解他们的需求,你将能够开发出用户愿意使用的可操作仪表板。最终,仪表板需要回答问题,让人们保持知情,并且易于使用。如果这三个要素没有得到满足,那么所有人都会受到影响。

良好的设计原则

很容易陷入构建酷炫可视化,拥有众多光滑功能的陷阱。始终记住仪表板的目的。它应该以易于理解的方式提供用户所需的信息。在构建仪表板时,你会面临许多挑战。当你开始面对这些挑战时,请使用以下章节中的提示。

限制使用的纸张数量

限制使用的表格数量——你不想用表格和杂乱的东西让用户感到不知所措。仪表板不应该难以使用(或理解)。通过限制仪表板中使用的表格数量,你限制了用户需要关注的元素。导致糟糕仪表板设计最常见的原因之一就是包含过多的表格。一般来说,你应该在仪表板中使用不超过三个可视化元素。

展示多个视图可以让你包含更多信息以及更细致的细节。更多信息也意味着用户可能会迷失在重要和不重要的事物中。在设计仪表板时考虑大局可以帮助减轻这种情况。

清晰简洁

创建各种图表类型很有趣。Tableau 使得根据视觉类型包含大量额外信息变得容易。再次强调,了解你的受众非常重要。尽量让他们容易获取他们想要的信息,即使这意味着简化你的设计。设计时考虑你的受众。一个好的仪表板是人们愿意使用的。人们更倾向于使用简单的仪表板而不是复杂的仪表板。

构建一个连贯的故事

构建一个连贯的故事——仪表板应该清晰有效地传达信息。你将面临的最大挑战之一是如何以无缝的方式将工作簿中的各种工作表组合在一个仪表板中。记住,你试图在有限的空间内展示大量数据。在朝着最终目标努力的过程中,你需要考虑工作表之间的关系。你讲述的故事取决于观众想要和需要看到的内容。

现在我们已经描述了一些良好的设计原则,让我们讨论如何使用仪表板和布局面板创建仪表板。

探索仪表板和布局面板

仪表板面板左侧菜单中有两个标签页。这两个标签页是不同的面板——仪表板和布局。仪表板面板允许您在仪表板上放置工作表和对象。它也是设置屏幕尺寸选项的地方。布局面板提供了对仪表板中工作表和对象格式的更精细控制。布局面板允许您精确地定位和填充仪表板中的项目。我们将在下一节中讨论这两个面板。

仪表板面板

在本节中,我们将开始构建我们的仪表板。为了创建仪表板,您必须至少创建了一个工作表。仪表板是一个空白页面,您可以在这里组合多个工作表。仪表板以多种方式具有交互性,主要是通过使用过滤器。要创建仪表板,请单击工作簿底部的“新建仪表板”按钮。仪表板标签位于工作簿底部:

点击工作簿底部的“新建仪表板”按钮后,将打开一个空白仪表板页面。与工作表页面类似,左侧面板中有两个标签页——仪表板和布局。仪表板面板是默认视图。仪表板面板包含四个主要部分:

  • 设备预览

  • 尺寸

  • 工作表

  • 对象

我们现在将更详细地讨论这些部分。以下截图显示了左侧面板中的四个主要部分(设备预览、尺寸、工作表和对象):

工作表

要将工作表添加到视图中,可以双击面板“工作表”部分下的名称,将工作表拖放到画布上,或者右键单击工作表名称并选择“添加到仪表板”。

在以下示例中,双击了标题为柱状图的工作表。现在,该工作表已添加到仪表板中,包括在柱状图工作表中应用的所有过滤器:

在工作表上右键单击会弹出以下菜单:

下面是每个项目的简要描述:

  • 添加到仪表板:将所选工作表添加到仪表板。

  • 从仪表板移除:从仪表板中移除所选工作表。

  • 前往工作表:带您进入 Tableau 工作簿中选定的工作表。

  • 复制工作表:创建选定工作表的副本。

  • 复制为交叉表:将选定的工作表复制为交叉表。这是一种查看以行和列形式使用在可视化中的数据的绝佳方式。下面的屏幕截图显示了仪表板中工作表的交叉表版本(柱状图):

图片

  • 隐藏:在 Tableau 工作簿中隐藏选定的工作表。

  • 重命名工作表...:允许您重命名选定的工作表。

除了复制工作表之外,您还可以复制仪表板。要这样做,请转到“工作表”菜单,右键单击“仪表板”选项卡,然后选择“复制”:

图片

复制仪表板会创建一个与复制仪表板外观完全相同的新的仪表板。新的仪表板仍然引用与原始仪表板相同的所有工作表。在下一节中,我们将讨论除了工作表之外可以添加到仪表板的各种对象。

对象

对象是您可以添加到仪表板的项目。对象允许您自定义仪表板的外观,并允许添加额外功能。要将对象添加到仪表板,请双击对象名称或将对象图标拖放到画布上。根据您选择的对象,您将有一些自定义选项。以下表格简要描述了每个对象:

图标 工作表和描述
图片 水平和垂直:这些选项提供水平和垂直布局容器,允许您分组相关项目。这些容器可以被视为仪表板的子部分。通过创建这些对象,您可以更好地控制仪表板特定区域的格式化。在下面的屏幕截图中,一个垂直布局容器被拖放到柱状图工作表下方:图片 您可以将其他对象放置在这个垂直容器中。调整此容器的大小也会影响其他对象的大小。注意,一旦包含垂直容器,柱状图工作表现在占仪表板一半的高度。
图片 文本:允许您为标题、描述和其他数据输入文本。在下面的屏幕截图中,一个文本对象被添加到仪表板顶部。文本内容为“仪表板标题”。您可以按需格式化文本!图片
图像:一个允许您输入图像的对象。在以下屏幕截图中,图像对象被添加到柱状图下方: 图像在仪表板中后,您可以进一步格式化它。单击图像对象然后右上角的向下箭头图标以显示可用于自定义图像的选项列表:
网页:一个允许您在仪表板中嵌入网页的对象。在以下屏幕截图中,图像对象被网页对象所取代。当双击网页对象图标或将其拖放到仪表板时,将出现一个 URL 窗口。在此处输入网页 URL 的名称,然后单击“确定”:
空白:一个允许您在仪表板中输入空白空间的对象。这将在您格式化和微调仪表板时有所帮助。

| | 扩展:允许您向 Tableau 仪表板添加扩展。在以下屏幕截图中,扩展对象被添加到网页对象所在的仪表板中。将出现一个“选择扩展”菜单:

扩展主题由于存在许多不同的扩展而超出了本书的范围。需要了解的重要一点是,扩展是与 Tableau 通信的 Web 应用程序。它们允许您使用通过 Tableau 连接到的数据使用自定义应用程序。要查看可用的扩展列表,请访问 Tableau 的扩展库,网址为 extensiongallery.tableau.com/

并非所有网页在添加到网页对象时都会显示。这主要是由于网络安全问题。如果您添加的页面不起作用,我们建议您谷歌搜索或查看 Tableau 表单以了解原因。

放置在仪表板中的表和对象以两种方式之一进行布局:网格或浮动。在下一节中,我们将讨论它们之间的区别。

网格对象与浮动对象

以下屏幕截图中显示了“对象”菜单。我们已在前一节中讨论了每个单独的对象。这里的切换菜单允许您在网格对象和浮动对象之间进行选择:

  • 网格对象:仪表板中的每个对象都使用网格机制进行排列。网格对象与其他网格对象对齐,以网格不重叠的方式形成一个视图。网格对象更容易处理。网格对象通常比浮动对象更好地根据显示设置调整大小。我们的建议是在可能的情况下使用网格对象。

  • 浮动对象:仪表板中的每个对象都可以自由放置在任何位置。浮动对象可以放置在其他对象之上——它们不受网格的限制。虽然浮动对象可以更好地利用空间,但这也有代价。这种代价是当屏幕大小改变时这些对象的渲染方式。平铺对象会根据屏幕设置自动调整大小,而平铺对象则不会。浮动对象的主要用途之一是用于图例。

当向仪表板添加多个工作表时,您必须考虑用户如何能够看到不同的可视化。最佳实践规定,用户不应需要滚动才能看到仪表板的不同元素。我们知道这并不总是可能的,但选择正确的显示设置可以极大地影响用户使用仪表板的便捷性。我们将在下一节中讨论显示大小和设备预览选项。

显示设置

要查看大小菜单,请点击仪表板当前大小右侧的下箭头。将出现一个弹出菜单,允许您从常用设备分辨率中选择。以下截图显示了结果:

图片

点击当前显示大小(固定大小)右侧的下箭头,将弹出大小选项。有三个大小选项,如下面的截图所示:

图片

以下是对大小选项的简要描述:

  • 固定大小:这是默认的大小。固定大小意味着仪表板的大小不会因查看器的屏幕大小而改变。如果仪表板扩展到屏幕大小之外或下方,用户将看到滚动条。每种大小选项都有其优缺点。使用固定大小的仪表板,您可以控制对象的精确位置。如果您选择使用浮动元素,固定大小的仪表板是建议的选项。在使用固定大小的仪表板时,您可以从以下建议中选择特定设备的选项:

图片

  • 自动:如果您希望 Tableau 确定显示设置,请选择此选项。Tableau 将尝试根据用户的屏幕大小调整窗口大小。

  • 范围:使用范围设置,您可以选择最小和最大显示大小。如果用户的显示小于所选的最小值,仪表板将调整到最小显示大小。同样,如果用户的显示大于所选的最大值,仪表板将调整到最大显示大小。

设备预览

在您的仪表板中添加项目后,您可以使用设备预览选项来查看仪表板在不同显示上的渲染效果。以下截图突出了在仪表板面板中点击设备预览按钮时出现的设备预览部分:

图片

使用设备布局菜单查看仪表板在不同设备上的外观。这是一个很好的方法来查看你的仪表板如何在另一个用户的设备上显示。记住,尽管仪表板在你的设备上看起来很好,但这并不意味着它在另一个用户的设备上看起来会一样。

现在我们已经讨论了仪表板面板,让我们继续到布局面板。

仪表板布局面板

正确的大小和排列使仪表板更容易使用。重新组织工作表位置、移动对象和一般的格式化操作可以帮助构建无缝的用户体验。在前面的章节中,我们讨论了仪表板面板中的显示设置和排列选项。现在我们将讨论可以应用于工作表和对象的附加格式化选项,以帮助完善你的仪表板。以下截图显示了布局面板中可用的选项:

以下是对布局选项的简要描述:

  • 显示标题:在仪表板上选择一个工作表或对象。勾选/取消勾选显示标题复选框将显示此项目的标题。使用此选项插入或删除标题。

  • 浮动:在仪表板上选择一个工作表或对象。勾选/取消勾选浮动复选框将项目从平铺改为浮动(或反之亦然)。

  • 位置:如果你为仪表板大小选择了固定大小或范围,那么你可以微调工作表和对象在仪表板上的显示位置。x 和 y 是从左上角起的偏移量,表示从该点的像素长度。

  • 大小:如果你将你的工作表或对象从平铺改为浮动,你可以手动设置宽度和高度。w 代表宽度,h 代表高度(以像素为单位)。

  • 边框:为工作表或对象添加边框。

  • 背景:为工作表或对象添加背景颜色。

  • 外边距:为工作表或对象添加外边距。外边距是添加到元素外部的空间 – 它增加了用于美观的空间:

  • 内边距:与外边距类似。这为工作表或对象添加内边距。内边距是添加到元素内部的空间 – 它增加了用于美观的空间。

  • 项目层次结构:如果你使用浮动对象,项目层次结构会显示对象是如何分层的。项目从上到下排序,这意味着层次结构中较高的对象位于其他项目之上:

在下一节中,我们将介绍另一种与用户分享你的分析的方法 – 故事。

讲述故事

在本节中,我们将讨论故事。为了创建一个故事,您必须至少创建了一个工作表。故事是一个空白页面,您可以在其中结合文本和其他对象。您创建多个故事点,依次展示以用数据讲述故事。故事是分享您分析结果的一种极好方式。要创建故事,请点击工作簿底部的“新建故事”按钮。故事标签位于工作簿底部:

图片

点击工作簿底部的“新建故事”按钮后,将打开一个空白故事页面。故事是一系列以有序格式展示的可视化。故事类似于 PowerPoint 演示文稿。故事由一系列故事点组成。以下截图显示了空白故事页面:

图片

故事面板左侧菜单中有两个标签。这两个标签是不同的面板 – 故事和布局。故事页面的布局类似于仪表板页面。故事面板允许您在故事中放置工作表和对象。它也是您设置屏幕尺寸选项的地方。布局面板提供了更精细的控制,以如何导航故事。我们将在下一节中讨论这两个面板。

故事面板

与仪表板类似,您应该考虑您故事的目的。您展示的数据以及您如何展示数据是讲述故事的主要组成部分。您正在引导观众得出一个应该用数据支持的结论。与仪表板一样,我们相信在开发之前您应该有一个计划或大纲。坐下来编写叙述将有助于使您的故事更加出色。

故事面板包含四个主要部分 – 新故事点、工作表、文本和大小。以下是对布局选项的简要描述:

  • 工作表:要将工作表添加到故事点,可以双击面板“工作表”部分下的名称,或者将工作表拖放到画布上。在以下示例中,标题为“柱状图”的工作表被双击。现在,该工作表已添加到故事面板中,包括在柱状图工作表中应用的所有过滤器。以下截图显示了添加柱状图工作表后的故事面板:

图片

  • 新故事点:如果你把你的故事看作是一次演示,那么故事点就是一个单独的幻灯片。故事是由多个按顺序传达观点或信息的故事点组成的。新故事点部分有两个按钮——空白和复制。空白按钮为你创建一个新的故事点来工作,而复制按钮则创建当前故事点的副本。在前面的屏幕截图中,只有一个故事点——故事点在故事标题下方的面板中间用灰色框表示。在下面的屏幕截图中,创建了一个空白故事点——注意现在画布上故事 1 的标题下有两个灰色框:

图片

  • 文本:点击以向你的故事点添加文本字段。在下面的屏幕截图中,向故事点添加了文本。你可以将文本字段拖放到故事点的任何位置,因为它是一个浮动对象。显示标题复选框控制是否显示故事点标题(以下屏幕截图中画布左上角的“故事 1”):

图片

  • 大小:选择你的故事的显示大小。这应该是你的用户将查看故事的大小。如果你点击大小选项中的向下箭头,将出现预定义的屏幕大小列表:

图片

现在我们已经快速浏览了故事面板,我们将转向布局面板。

故事布局面板

布局面板包含有关如何向用户展示导航选项的选项。你可以从标题框、数字、点和箭头中进行选择。尝试这些设置以找到最适合你故事的方法:

图片

一旦你完成了你的故事,你可以使用 Tableau 的演示模式来分享它,或者将故事发布到 Tableau 服务器。全屏按钮位于菜单栏的右上角:

图片

到目前为止,在本章中,我们已经讨论了创建仪表板和故事可用的功能和选项。你现在拥有了创建和分享你想要讲述的故事的专业视角所需的所有部件。随着我们旅程的结束,我们将以我们对制作引人注目的数据可视化的最终思考作为结尾。

摘要

创建仪表板和故事是艺术和科学的结合。你开发出的可视化效果只与基础数据的好坏相匹配。如果数据不准确,那么解决方案至多是无用的,在最坏的情况下是有害的。对于用户来说,没有信息比他们被误导认为准确的不正确信息更有益。可视化的信息必须是真实的。好的可视化可以增强信息。它们使用户能够识别趋势,发现模式,更有效地理解信息。

在这本书的整个过程中,你已经学习了如何使用 Tableau。现在你应该对以下关键概念感到熟悉:

  • 连接到并建模你的数据

  • 在工作表中处理数据

  • 根据你的数据选择合适的图表类型

  • 绘制地理数据

  • 创建自定义计算

  • 理解细节级别LOD)表达式

  • 使用 Tableau 的嵌入式分析功能

  • 通过仪表板和故事分享你的分析

我们从解释 Tableau 如何帮助你和你所在的组织更好地理解你的数据开始我们的旅程。我们希望你已经了解了 Tableau 的关键特性以及如何使用它们来充分利用你的数据。虽然这本书中介绍的概念不是全面的,但它们足以帮助你通过 Tableau Desktop 认证考试。提高 Tableau 技能的最好方法是开始使用它。你现在有一个坚实的基础来构建。我们给你的最后建议是找到你想要回答的问题,获取数据来这样做,并使用你在本书中学到的技巧来帮助你创建准确、直观且视觉上令人惊叹的报告解决方案。

第十章:模拟测试 A + B(评估)

模拟测试 A 和 B

对于模拟测试 A 和 B,你需要以下数据:

考试包括以下部分:

计算 1-7

数据连接 8 - 13

分析 14 - 19

组织数据 20 - 23

分箱 24 - 26

仪表板 27 - 28

映射 29 - 30

测试 A

问题 1:使用 Superstore 数据集回答以下问题。除了消费者细分市场之外,2013 年到 2014 年间盈利率的百分比变化是多少?

  1. 23.89%

  2. 40.17%

  3. 24.17%

  4. 32.74%

问题 2:使用星战数据集回答以下问题。橙色眼睛的男性角色的最常见首字母是什么?

  1. S

  2. A

  3. T

  4. C

问题 3:使用 Superstore 数据集回答以下问题。2014 年所有产品对在 2012 年也下过订单的客户的总销售额是多少?

  1. 2,677,439

  2. 4,139,150

  3. 587,457

  4. 4,299,866

问题 4:使用泰坦尼克号乘客名单数据回答以下问题。名单上有多少戴维斯姓氏的人?

  1. 1

  2. 7

  3. 18

  4. 2

问题 5:COUNTD 函数返回组中不同项目的数量。是否正确,即 null 项目被视为一个单独的项目?

问题 6:使用 2018 FIFA 名单回答以下问题。出生于 1990 年之前的球员中,有多少人进球超过 10 个?

  1. 19.29%

  2. 80.71%

  3. 11.96%

  4. 88.04%

问题 7:对于任何聚合计算,以下哪个说法是正确的或错误的:你不能将聚合值和非聚合值结合在一起?

问题 8:使用超市数据集回答以下问题:2014 年东南亚从未退货的商品的总销售额是多少?

  1. 23,161

  2. 212,726

  3. 306,769

  4. 323,068

问题 9:使用苹果数据集,回答以下问题:新鲜和冷冻苹果的平均价格是多少?

  1. 2.126

  2. 0.51

  3. 1.616

  4. 1.063

问题 10:使用 FIFA 比赛结果和 2018 FIFA 名单数据回答以下问题。在 2018 年获得过冠军的队伍中,有多少名出生于 1990 年之前?

  1. 12

  2. 4

  3. 0

  4. 23

问题 11:使用酿酒生产规模数据集回答以下问题。对于生产规模小于一桶的酿酒厂,2017 年和 2018 年出口产品的百分比差异是多少?

  1. -45.51%

  2. -16.35%

  3. 45.5%

  4. 7.24%

问题 12:使用超市数据集回答以下问题。在消费者细分市场中,给予最少折扣的经理是谁?

  1. 安娜·安德雷迪

  2. 阿莱杭德罗·巴伦蒂内

  3. 莎莉·丹尼尔斯

  4. 尼科尔·汉森

问题 13:何时使用数据混合而不是 JOIN 会更好?

  1. 当你无法通过 JOIN 结合数据源时

  2. 当数据混合是唯一可用的选项时

  3. JOIN 不提供所需的灵活性时

  4. 当你需要避免数据重复而不丢失无关数据时

问题 14:使用 FIFA 比赛结果数据集回答以下问题。创建一个条形图,显示年份和进球数。添加 65% 到 80% 的分布带。65% 平均值是多少?

  1. 77.3175

  2. 65

  3. 95.16

  4. 73.65

问题 15:使用 NFL 统计数据集回答以下问题。创建一个散点图,使用 College Wins 和 Age 详细说明 Player。线性趋势线的标准误差是多少?

  1. <0.001

  2. 0.800443

  3. 86.3054

  4. 148.27

问题 16:使用 NFL 统计数据集回答以下问题。使用箱线图,找出球员身高的下四分位数是多少?

  1. 66

  2. 71

  3. 73

  4. 76

问题 17:线性趋势线何时可以被认为是显著的?

  1. 当 t-value >= 0.5

  2. 当标准误差 <= 5.0

  3. 当 R-squared >= 0.05

  4. 当 p-value <= 0.05

问题 18:Tableau 使用哪两种方法来确定预测中的季节性?

  1. 时间性和非时间性

  2. 粒度和非粒度

  3. 线性和非线性

  4. 季节性和非季节性

问题 19:你会使用哪个 Tableau 选项来区分标记(单个数据点)并在视图中指出它们的 X/Y 轴位置?

  1. 工具提示

  2. 轴线

  3. 折线

  4. 参考线

问题 20:使用 2018 年 FIFA 球员名单数据集回答以下问题。创建一个层次结构组 - 位置。在 B 组中,哪些位置(球员在国家队的出场次数)进球最多?

  1. 268

  2. 340

  3. 414

  4. 0

问题 21:使用 2018 年 FIFA 球员名单数据集回答以下问题。查看 FW 位置,前三名球员进球的百分比是多少?

  1. 88.86%

  2. 6.03%

  3. 48.14%

  4. 11.14%

问题 22:是否可以使用图例手动排序数据?

  1. 正确

  2. 错误

问题 23:固定详细程度级别LOD)过滤器是在上下文过滤器之前执行的吗?

  1. 正确

  2. 错误

问题 24:使用 NFL 统计数据集回答以下问题。在 2013 年之前的五年内,球员年龄的移动平均数是多少?

  1. 24.50

  2. 23.89

  3. 24.15

  4. 24.32

问题 25:使用 NFL 统计数据集回答以下问题。使用直方图,为球员的体重创建一个使用 10 为箱大小的可视化。对于体重 230-240 磅的球员,平均跳跃距离是多少?

  1. 88.27

  2. 91.94

  3. 73.89

  4. 109.46

问题 26:基于知识。在 Tableau 中,是否可以使用箱来表示连续度量?

  1. 正确

  2. 错误

问题 27:使用 Tableau 职场工作簿回答以下问题。哪个职位持有建筑师职位的最高平均工资?

  1. 商业智能架构师

  2. 数据仓库架构师

  3. Tableau 服务器管理员

  4. 安全管理员

问题 28:基于知识。在构建仪表板时,字符串和日期比数字和布尔值减慢性能吗?

  1. 正确

  2. 错误

问题 29:使用样本超市数据集回答以下问题。在 Seattle 30 公里范围内的城市的利润总和是多少?

  1. 29,156

  2. 27,391

  3. 56,024

  4. 31,887

问题 30:使用样本超市数据集回答以下问题。使用地图回答以下问题:哪些州组的利润最高?

  1. 爱达荷州,蒙大拿州,北达科他州

  2. 怀俄明州,南达科他州,内布拉斯加州

  3. 明尼苏达州,威斯康星州,艾奥瓦州

  4. 犹他州,科罗拉多州,新墨西哥州

答案键测试 A

答案 1:3. 24,17%

将订单日期和利润添加到视图中:

创建一个快速表计算来查看百分比差异:

创建一个过滤器以排除消费者

选择文本表以查看数据:

你的答案应该看起来像这样。正确答案是 4.01%:

答案 2:1. S

首先创建一个计算字段:

然后,创建以下计算:

添加到视图中:

为性别创建过滤器:

为眼睛颜色创建过滤器:

现在双击记录数

你的答案应该看起来像这样。有两个记录是 R 和 S。S 是正确答案的唯一选项:

答案 3:2. 4,139,150

首先在[客户名称]上创建 LOD 计算字段:

然后,将年份、类别和销售额添加到视图中:

使用我们创建的2012 年客户计算字段创建过滤器,并筛选出符合该标准的结果。注意,过滤器对 2012 年的列没有影响,但调整了其余部分以匹配也在 2012 年下订单的客户:

你的答案应该看起来像这样:

![](https://github.com/OpenDocCN/freelearn-ds-zh/raw/master/docs/tbl-dsk-cert-ass-exgd/img/11735abd-7147-4c2c-a848-e9d652f85782.png)

答案 4:2. 7

在添加数据源时,将name字段拆分以划分列:

拆分 1列重命名为姓氏

姓氏记录数添加到视图中:

滚动到最后一个名字戴维斯。正确答案是 7:

答案 5:2. 错误

NULL 值不计入:

答案 6:1. 19.29%

添加数据源,确保所有字段,特别是出生日期(DOB),都被识别为这样的字段:

创建计算字段以将球员分为两组:超过 10少于 10

为出生于 1990 年之前的人员创建过滤器:

现在,将进球数记录数字段添加到视图中:

现在,创建一个快速表格计算来找出记录总数的百分比:

你的答案应该看起来像这样,答案显示进球超过 10 球的球员百分比是 19.29%:

答案 7:1. 正确

对于任何聚合计算,你不能将聚合值和非聚合值组合在一起。例如,SUM(Price)[Items]* 不是一个有效的表达式,因为 SUM(Price) 是聚合的,而 Items 不是。然而,SUM(PriceItems)* 和 SUM(Price)SUM(Items)* 都是有效的。有关更多信息,请参阅help.tableau.com/current/pro/desktop/en-us/calculations_calculatedfields_aggregate_create.htm

答案 8:3. 306,769

首先,我们需要使用 Order ID 上的 Left JOIN 将 Orders 和 Returns 表连接起来:

图片

然后,将订单日期、区域和销售添加到视图中:

图片

通过过滤器排除退货项目:

图片

你的答案应该看起来像这样:

图片

答案 9:4. 1.063

首先在添加数据源时使用数据解释器来清理数据:

图片

因此,你应该看到以下列:

图片

过滤掉我们正在寻找的苹果形式:

图片

将平均零售价格度量添加到视图中:

图片

注意,度量默认以 SUM 添加。我们需要平均值,所以将其切换到 AVG:

图片

你的答案应该看起来像这样:

图片

答案 10:1. 12

对于这个问题,我们不得不使用数据混合。这将允许我们使用两个数据源而不进行 JOIN,从而消除数据集中添加任何额外行的可能性。

首先添加数据源之间的关系:

图片

在列表中选择 WorldCups:

图片

接下来,使用 WC 队伍数据,根据球员的出生日期过滤球员:

图片

在 WorldCups 数据源中,创建一个计算字段,根据获胜次数对获胜者进行排名:

图片

Rank WinnersWinners字段添加到视图中:

图片

只保留巴西:

图片

Name字段添加到视图中:

![图片](https://github.com/OpenDocCN/freelearn-ds-zh/raw/master/docs/tbl-dsk-cert-ass-exgd/img/342a3932-ea08-4b32-af0d-12f58724ec8b.png)

看屏幕的左下角。你有 12 行数据。这就是答案:

图片

答案 11:1. -45.51%

首先,我们需要将所有三个表进行 UNION:

图片

接下来,使用数据解释器清理表格:

图片

将表列重命名为Year并将数据格式更改为日期:

将年份、桶数和总发货量拖入视图中:

仅保留生产量低于 1 桶的酿酒厂:

使用快速表格计算,计算年份数据之间的百分比差异:

你的答案应该看起来像这样:

答案 12:4. 尼可莱·汉森

首先使用区域作为键将两个表 People 和 Orders 左连接:

然后将段、人员和折扣字段拖入视图中:

仅保留消费者:

按降序排列数据:

你的答案应该看起来像这样:

答案 13:4. 当你需要避免数据重复时。

在某些情况下,更改 JOIN 条件不足以避免数据重复,以及某些未链接的数据可能不包括在 JOIN 中。此时,数据混合将是最佳选择,创建包含所有来源合并数据的合并数据源,且无重复。

答案 14:1. 77.3175

首先将年份和进球数添加到视图中:

将年份从连续转换为离散:

使用左侧的“分析”选项卡添加表格分布带。将分布的下限百分位数更改为反映 65% 到 80% 的范围:

将鼠标悬停在“平均值的 65%”上。你的答案应该看起来像这样:

答案 15:4. 148.27

将学院胜利和年龄添加到视图中:

在标记的详细部分放下球员:

添加线性趋势线:

右键点击趋势线并选择描述趋势模型:

你的答案应该看起来像这样:

答案 16:2. 71

首先让我们将身高和球员添加到视图中。你会立刻看到,对于一些球员,例如亚历克斯·史密斯,身高是 1,300 英寸。显然,我们有一些数据重复。因此,让我们创建一个简单的 LOD 计算公式,为每位球员提供一个值。创建一个以下公式计算的计算字段:

将此新度量值与球员一起添加到视图中:

在“显示我”中选择胡须图:

将鼠标悬停在可视化上。下四分位数是下铰链的另一个名称。你的答案应该看起来像这样:

答案 17:4. 当 p 值 <= 0.05

help.tableau.com/current/pro/desktop/en-us/trendlines_add.htm.

答案 18:1. 时间和非时间

help.tableau.com/current/pro/desktop/en-us/forecast_how_it_works.htm.

答案 19:3. 抛物线

help.tableau.com/current/pro/desktop/en-us/inspectdata_droplines.htm.

答案 20:1. 268

首先创建层次结构,将维度位置拖放到维度上:

然后,通过双击将新创建的位置以及帽子戏法和高尔夫球目标添加到视图中:

展开层次结构,并按降序排序数据:

你的答案应该看起来像这样:

答案 21:4. 11.14%

首先,让我们为前三名球员创建一个集合:

你想使用进球字段创建一个集合:

接下来,将新的集合以及位置和目标添加到视图中:

现在我们需要使用通过向下表计算得出的总百分比创建一个表格计算:

你的答案应该看起来像这样:

答案 22:1. 是

help.tableau.com/current/reader/desktop/en-us/reader_sort.htm.

答案 23:2. 否

help.tableau.com/current/pro/desktop/en-us/order_of_operations.htm.

答案 24:3. 24.15 年

首先将选秀年份的数据类型更改为日期:

将其转换为离散值:

将选秀年份和年龄添加到视图中:

将年龄总和改为平均值:

添加移动平均表格计算:

编辑表格计算。选择最后五个数据点的平均值,并取消选中当前值,因为我们不希望 2013 年的数据包含在计算中:

你的答案应该看起来像这样:

答案 25:1. 88.27

将权重添加到视图中:

图片

从“显示我”中选择“直方图”:

图片

你会注意到“重量(区间)”出现在维度中。点击“编辑”并选择区间大小10

图片

将“跳远”拖到“标记”中的工具提示卡上,并从“求和”切换到“平均值”:

图片

悬停在“230-240”区间上。你的答案应该看起来像这样:

图片

答案 26:1. 正确。

help.tableau.com/current/pro/desktop/en-us/calculations_bins.htm.

答案 27:1. 商业智能架构师

首先,展开“位置”层次结构:

图片

现在按平均估计工资的降序排序:

图片

你的答案应该看起来像这样:

图片

答案 28:1. 正确

help.tableau.com/current/pro/desktop/en-us/performance_tips.htm.

答案 29:4. 31,887

首先,将“城市”和“利润”添加到视图中:

图片

从“显示我”菜单中选择地图符号。

图片

找到西雅图:

图片

前往地图,然后地图选项,选择单位为公制:

图片

使用径向选择工具来测量距离:

图片

将测量工具拉伸以反映 30 公里:

图片

看看左下角。你的答案应该看起来像这样:

图片

答案 30:1. 爱达荷州、蒙大拿州、北达科他州

将“州”和“利润”添加到视图中:

图片

从“显示我”菜单中选择地图符号:

图片

将州组合在一起:

图片

收起状态药丸,只显示国家:

图片

将鼠标悬停在州上,查看哪个州最盈利。你的答案应该看起来像这样:

图片

测试 B

问题 1:使用《超市》数据集回答以下问题。2012 年和 2013 年之间,所有细分市场的销售额百分比变化是多少?

  1. 23.48%

  2. 32.37%

  3. 25.16%

  4. 23.92%

问题 2:使用《星球大战》数据集回答以下问题。女性角色中,最常见的蓝色眼睛的首字母是什么?

  1. A

  2. J

  3. B

  4. N

问题 3:使用《超市》数据集回答以下问题。2014 年,所有客户从消费者细分市场订购商品的总销售额是多少?

  1. 1,194,052

  2. 1,503,262

  3. 1,463,760

  4. 1,766,155

问题 4:使用泰坦尼克号乘客名单数据回答以下问题。乘客名单上最常见的姓氏是什么?

  1. Sage

  2. Johnston

  3. West

  4. Smith

问题 5:中值函数返回有序值集中的值,其上下两侧有相等数量的值,这是真的还是假的?

问题 6:使用 FIFA 2018 阵容回答以下问题。出生于 1992 年 1 月 1 日之后且进球超过 15 球的球员百分比是多少?

  1. 97.29%

  2. 17.24%

  3. 9.92%

  4. 2.03%

问题 7:如果你在可视化中没有所有需要的数据值,现在是使用快速表格计算的最佳时机,这是真的还是假的?

问题 8:使用 Superstore 数据集回答以下问题:2013 年中亚地区退货商品的总销售额是多少?

  1. 14,094

  2. 44,658

  3. 4,833

  4. 1,453

问题 9:使用 Apples 数据集,回答以下问题:新鲜和即饮苹果的平均每杯价格是多少?

  1. 0.4353

  2. 0.3754

  3. 0.3156

  4. 0.2973

问题 10:使用 FIFA 比赛结果和 2018 FIFA 阵容数据回答以下问题。在 2018 年排名第四的球队中,有多少名球员是在 1988 年之前出生的?

  1. 3

  2. 5

  3. 7

  4. 18

问题 11:使用酿造生产规模数据集回答以下问题。哪个生产规模(按桶计算)在 2018 年酿造厂数量增加最多?

  1. 低于 1 桶

  2. 1 到 1k 桶

  3. 1k 到 7,5k 桶

  4. 7,5k 到 15k 桶

问题 12:使用 Superstore 数据集回答以下问题。在企业部门中,哪个区域最不盈利的经理叫什么名字?

  1. Anthony Jacobs

  2. Shirley Daniels

  3. Kelly Williams

  4. Alejandro Ballentine Corporate

问题 13:如果你的文件类型不在连接下列出,唯一的选择是将文件转换为支持的格式,这是真的还是假的?

问题 14:使用 FIFA 比赛结果数据集回答以下问题。使用年份和比赛次数创建条形图。添加标准差为-0.5,0.5 的分布带。平均值以上的标准差是多少?

  1. 50.409

  2. 33.190

  3. 47.753

  4. 12.874

问题 15:使用 NFL 统计数据集回答以下问题。使用 College Wins 和 College Losses 详细按球员创建散点图。这个数据的线性趋势线是否可以认为是显著的?

问题 16:使用 NFL 统计数据集回答以下问题。使用箱线图,找出球员胜利的值是多少?

  1. 546

  2. 349

  3. 721

  4. 1168

问题 17:使用 Tableau,你可以创建预测,而你需要的只是一个维度和一个度量,这是真的还是假的?

问题 18:完全指定模型所需的参数数量叫什么?

  1. 模型观测值

  2. 模型数据点

  3. 模型自由度

  4. 模型参数

问题 19:是否可以使用聚类对视图中的任何维度进行操作?

  1. 正确

  2. 错误

问题 20:使用 2018 年 FIFA 阵容数据集回答以下问题。创建一个组 - 位置的层次结构。哪个组 FW 位置进球最多?

  1. F

  2. H

  3. A

  4. D

问题 21:使用 2018 年 FIFA 阵容数据集回答以下问题。查看 FW 位置,在所有球员中,基于他们的进球,前 10 名球员在国家队(出场次数)中所占的百分比是多少?

  1. 7.86%

  2. 6.03%

  3. 20%

  4. 12.59%

问题 22:是否可以在层次结构内手动对视图中的数据进行排序?

  1. 正确

  2. 错误

问题 23:度量过滤器是否总是先于维度过滤器执行?

  1. 正确

  2. 错误

问题 24:使用 NFL 统计数据集回答以下问题。根据出生日期,最年轻球员(过去三年)的胜利移动平均数是多少?

  1. 50,998

  2. 28,476

  3. 72,427

  4. 63,596

问题 25:使用 NFL 统计数据集回答以下问题。使用直方图,创建一个跳跃的视觉表示,玩家使用两英寸的箱大小。进行最长跳跃的球员的平均身高是多少?

  1. 73.21

  2. 71.45

  3. 73.89

  4. 72.57

问题 26:知识型。基于某些条件定义数据子集的自定义字段叫什么?

  1. 参数

  2. 集合

  3. 字段

问题 27:使用 Tableau 工作簿回答以下问题。有多少个职位空缺是针对 Tableau 开发者的?

  1. 52

  2. 109

  3. 33

  4. 2

问题 28:知识型。网页可以包含在 Tableau 仪表板中吗?

  1. 正确

  2. 错误

问题 29:使用样本超市数据集回答以下问题。在距离莱希 10 英里范围内的城市的销售额总和是多少?

  1. 1,517

  2. 4,511

  3. 17,366

  4. 9,821

问题 30:使用样本超市数据集回答以下问题。使用地图回答以下问题:哪个州在印第安纳州周围销售了最多数量的商品?

  1. 伊利诺伊州

  2. 密歇根州

  3. 肯塔基州

  4. 俄亥俄州

答案键测试 B

关于如何回答每个问题的程序,请参阅测试 A 的答案键,因为它们遵循相同的结构。

答案 1:2. 32.37%

答案 2:3. B

答案 3:2. 1,503,262

你正在寻找的 LOD 计算的公式是:{ FIXED [Order ID]: MIN(IF [Segment] = "Consumer" then "in" else "out" END)}

答案 4:1. Sage

答案 5:1. 正确

问题 6:4. 2.03%

答案 7:2. 错误 (help.tableau.com/current/pro/desktop/en-us/calculations_calculatedfields_understand.htm)

答案 8:4. 1,453

答案 9:2. 0.3754

答案 10:4. 18

答案 11:1. 低于 1 桶

答案 12:4. Alejandro Ballentine Corporate

答案 13:2. 错误 (help.tableau.com/current/pro/desktop/en-us/basicconnectoverview.htm)

答案 14:1. 50.409

答案 15:1. 是,基于 p 值 <= 0.05

答案 16:4. 1168

答案 17:2. 否 (help.tableau.com/current/pro/desktop/en-us/forecasting.htm)

答案 18:3. 模型自由度

答案 19:2. 否 (help.tableau.com/current/pro/desktop/en-us/clustering.htm)

答案 20:1. F

答案 21:3. 20

答案 22:否

答案 23:否 (help.tableau.com/current/pro/desktop/en-us/order_of_operations.htm)

答案 24:2. 28,476

答案 25:1. 73.21

答案 26:3. 集合 (help.tableau.com/current/pro/desktop/en-us/sortgroup_sets_create.htm)

答案 27:3. 33

答案 28:1. 是 (help.tableau.com/current/pro/desktop/en-us/dashboards_best_practices.htm)

答案 29:2. 4511

答案 30:1. 伊利诺伊

就是这个。做得好!

posted @ 2025-10-24 10:09  绝不原创的飞龙  阅读(3)  评论(0)    收藏  举报