IBM-数据分析师-II-笔记-全-
IBM 数据分析师 II 笔记(全)
001:《数据分析Excel基础》|课程介绍 📊
在本节课中,我们将要学习IBM数据分析师专业证书第二门课程《数据分析Excel基础》的整体介绍。这门课程旨在帮助你掌握使用Excel电子表格进行数据分析的核心技能,为成为一名数据分析师打下坚实基础。
课程目标与内容概述 🎯
这门IBM课程旨在帮助你熟练使用Excel,并为你提供数据清洗和分析方面的扎实基础。这些技能是成为数据分析师所需技能组合的重要组成部分。
你将不仅学习使用电子表格进行数据分析的技术,还会在整个课程中通过多个动手实验进行实践。
课程模块详解 📚


以下是本课程五个核心模块的详细介绍。
模块一:电子表格基础
在模块一中,你将学习电子表格的基础知识,包括电子表格术语、界面以及在工作表和工作簿中的导航方法。
模块二:数据处理基础
上一节我们介绍了电子表格的基础操作,本节中我们来看看数据处理的核心功能。在模块二中,你将学习选择数据、输入和编辑数据、复制与自动填充数据、格式化数据,以及使用函数和公式。
模块三:数据清洗与整理
掌握了基础数据处理后,数据质量至关重要。在模块三中,你将学习使用电子表格清洗和整理数据,包括数据质量和数据隐私的基础知识、删除重复和不准确的数据、删除空行、消除数据不一致和空格,以及使用快速填充和分列功能。
模块四:数据分析技术
数据准备就绪后,便可进行分析。在模块四中,你将学习使用电子表格分析数据,包括筛选数据、排序数据、使用常见的数据分析函数、创建和使用数据透视表,以及创建和使用切片器与时间线。
模块五:实战项目与成果交付
在模块五中,你将在课程结束时完成一系列动手实验,这些实验将指导你如何创建作为数据分析师的第一个交付成果。这将涉及理解业务场景、清洗和准备数据以及分析数据。
课程特色与学习方法 🔄

在整个课程中,你将跟随两个不同的业务场景,每个场景使用其自己的数据集。这些不同的场景和数据集将用于课程视频和动手实验中。
学习成果 📈
完成本课程后,你将能够:
- 理解电子表格如何作为数据分析工具使用。
- 理解何时使用电子表格作为数据分析工具及其局限性。
- 创建电子表格并解释其基本功能。
- 使用Excel执行数据整理和数据清洗任务。
- 使用Excel电子表格中的筛选、排序和数据透视表功能分析数据。
- 执行一些中级的数据整理和数据分析任务来解决业务场景。
支持与帮助 🤝
课程团队和其他学员可在课程讨论论坛中提供帮助,以防你需要任何协助。
让我们开始观看下一个视频,你将在其中获得对电子表格的介绍。

本节课中我们一起学习了《数据分析Excel基础》课程的整体框架、学习目标、各模块核心内容以及最终你将掌握的能力。准备好开始你的Excel数据分析之旅吧!
002:电子表格入门 📊
在本节课中,我们将介绍电子表格的基本概念,列举常见的电子表格应用程序,了解其核心功能,并探讨为何电子表格是数据分析师的有用工具。

常见的电子表格应用程序
市场上有多种电子表格应用程序可供选择。其中一些更为知名和常用,有些是免费的,而另一些则需要付费。
目前,最常用且功能最全面的电子表格应用程序是 Microsoft Excel。其桌面版作为Office套件或部分Microsoft 365订阅的一部分需要付费,但也存在一个名为 Excel for the web(亦称Excel在线版)的网页版精简版本。在线版对拥有Microsoft账户的用户免费,但不提供桌面版的所有高级功能。
其次是 Google Sheets,它提供了许多(尽管不是全部)Excel的功能,并且对拥有Google账户的用户免费。这是一个基于网页的应用程序,能很好地与Google表单、Google Analytics和Google Data Studio等其他Google应用集成。
此外还有 LibreOffice Calc,这是一个完全免费、开源的桌面电子表格应用程序。它提供的功能比Excel或Google Sheets更基础,但仍包含许多数据分析所需的工具,如图表、条件格式和数据透视表。
其他电子表格应用程序还包括:功能全面的网页版应用 Zoho Sheet(可与Google Sheets媲美)、OpenOffice Calc、面向Salesforce的 Quip、主要用于项目管理的 Smartsheet,以及随苹果设备(如Mac电脑)附带的 Apple Numbers(也可通过App Store在其他苹果设备上获取)。
因此,您有多种电子表格应用程序选项,从功能全面到基础版,从云端应用到桌面应用,从付费版本到免费版本。您可以根据自己的需求和预算来决定使用哪一款。
电子表格的核心功能
上一节我们了解了有哪些电子表格软件,本节中我们来看看电子表格的核心功能。电子表格相对于手动计算方法具有多项优势。
例如,一旦正确编写了公式,您就可以确保计算是准确的,并且计算将自动为您执行。
电子表格还有助于保持数据的组织性和易于访问性。您的数据可以轻松地进行格式化、筛选和排序以满足需求。如果在数据输入或计算中出错,您可以轻松地编辑、撤销或使用错误检查工具来纠正这些错误。
最后,您可以在电子表格中分析数据,并创建图表、图形和报告,以帮助可视化您的数据分析结果。
自20世纪70年代个人电脑电子表格软件(如Apple II上的VisCalc)首次出现在市场上以来,电子表格在功能和特性方面已经取得了长足的进步。它们已从简单的表格和相对基础的计算,发展成为用于分析、管理和可视化海量数据集的强大工具。
电子表格的典型用途


以下是电子表格应用程序最常见的商业用途:

- 数据录入与存储
- 比较大型数据集
- 建模与规划
- 图表制作
- 识别趋势
- 业务流程流程图
- 跟踪业务销售
- 财务预测
- 统计分析
- 损益会计
- 预算编制
- 法务审计
- 薪资与税务报告
- 开具发票
- 日程安排
除了商业用途,其他典型用途还包括:
- 个人开支管理
- 家庭预算
- 食谱库
- 健身追踪
- 卡路里计数与体重监测
- 体育联赛(如梦幻足球)管理
- 音乐库编目
- 联系人列表、购物清单和圣诞贺卡清单
电子表格在数据分析中的应用

作为数据分析师,您可以将电子表格用作数据分析任务的工具,具体包括:
- 数据收集与获取:从一个或多个来源收集和获取数据。
- 数据清理:清理数据以移除重复项、不准确之处、错误并解决缺失值,从而提高数据质量。
- 数据分析:通过筛选、排序和解释数据,以确定可以从数据中获取哪些有用信息。
- 数据可视化:帮助您向关键业务利益相关者及组织内任何其他相关方讲述数据分析发现的故事。

总结
本节课中,我们一起学习了电子表格的入门知识。我们了解了一些常见的电子表格应用程序、电子表格的主要功能以及为何电子表格可能是数据分析师的有用工具。

在下一个视频中,我们将探讨电子表格的基础知识,包括常见的电子表格术语。
003:电子表格基础(第一部分)
在本节课中,我们将开始学习使用电子表格应用程序的基础知识。我们已经了解了可用的电子表格软件以及为何电子表格是数据分析师的有用工具。接下来的内容将基于Excel桌面版进行讲解,但其中大多数任务同样适用于Excel在线版及其他应用程序(如Google Sheets)。
📚 基础术语介绍
首先,我们来了解一些基础的电子表格术语。



工作簿与工作表

打开Excel时,你可以选择创建一个新的空白工作簿或打开一个现有工作簿。我们选择“新建”一个“空白工作簿”。
- 工作簿是Excel中的最高层级组件,以
.xlsx文件形式存在。因此,当你打开或创建一个工作簿时,实际上是在操作一个.xlsx文件。工作簿包含了你的所有数据、计算和函数,并由多个基础元素构成。 - 工作表是工作簿的组成部分,每个工作表在Excel中由一个标签页表示。默认情况下,每个标签页被命名为Sheet1、Sheet2等。为了使工作表标签更具意义,通常会对它们进行重命名,以更贴合工作表的目的,例如“一月销售”或某个区域、门店的名称。
以下是重命名工作表的方法:
- 右键单击标签页,选择“重命名”。
- 或者,直接双击工作表标签页的名称进行重命名。
工作表标签可以命名为任何符合你特定需求的名称,以便于理解该工作表所代表的内容。当前被高亮显示的工作表标签所对应的工作表,被称为活动工作表。
单元格、行、列与单元格引用
每个工作表都由大量称为单元格的矩形框组成。这些单元格用于存放你的数据,数据可以是文本、数字、公式或计算结果。

单元格按以下方式组织:
- 列:垂直排列,使用字母系统标识(例如,这是B列)。
- 行:水平排列,使用数字系统标识(例如,这是第7行)。
每个单元格由一个单元格引用表示,它本质上是列字母和行数字的组合。例如,如果我们点击工作表中心附近的某个位置,现在选中的是单元格 M20。这通常被称为活动单元格。活动单元格不仅通过单元格高亮的边框来指示,在工作表的左上角,你也会在一个小方框中看到其单元格引用(显示为 M20)。
重要提示:单元格引用总是先写列字母,后跟行数字,即 M20(第M列,第20行)。
单元格区域


工作簿的最后一个重要元素是单元格区域。它标识了一组被同时选中的单元格。这可能是同一行或同一列的多个单元格,也可能是多行多列的组合。
你可以通过以下方式选择单元格区域:
- 使用鼠标:选中第一个单元格,然后拖动以包含其他单元格。
- 使用键盘:
Shift+ 方向键。
这个单元格范围通常被称为数组,最常用作计算和公式中的引用。例如,如果你想对D9到D19单元格之间的所有值求和,你需要在公式中指定这个单元格区域。

注意:单元格区域使用冒号 : 分隔单元格引用来表示。
- 对于同一列的连续单元格:
D9:D19 - 对于同一行的连续单元格:
D9:H9 - 对于多行多列的矩形区域:
D9:H19
我们将在后续课程学习计算和公式时看到这种表示法的应用。这些单元格区域甚至可以引用另一个工作表中的单元格,这通常被称为三维引用。
现在,我们可以关闭这个工作簿,无需保存。

🎯 本节总结
在本节视频中,我们学习了电子表格的一些基本术语和元素,包括工作簿、工作表、单元格、行、列、单元格引用以及单元格区域。



在下一节视频中,我们将讨论如何在电子表格中导航、如何使用功能区与菜单,以及如何选择数据。
004:电子表格基础(第二部分)📊

在本节课中,我们将学习如何在Excel工作表中进行导航、熟悉功能区与菜单,并掌握选择数据的基本方法。这些是高效使用Excel进行数据分析的重要基础。
现在我们已经对工作表的基本构成元素有了初步了解,接下来看看如何在电子表格中移动、熟悉功能区与菜单,并学习如何在工作表中选择数据。


要打开示例文件,我们点击“文件”选项卡。这会打开后台视图,在这里你可以创建新工作簿,或打开、保存、打印工作簿。你也可以访问Excel选项。现在我们要打开示例文件,因此点击“打开”,然后从“最近使用的文件”列表中选择,或点击“浏览”找到所需的数据文件。
我们首先应该熟悉功能区与菜单。请注意,顶部的功能区包含多个选项卡。其中一些选项卡(如“开始”、“插入”、“视图”)你可能在其他Office产品中见过,而另一些(如“公式”、“数据”、“Power Pivot”)可能是新接触的。

为了给自己腾出更多工作空间,我们可以通过双击任意选项卡来隐藏功能区;要取消隐藏,再次双击即可。另一个选项是使用快捷键 Ctrl + F1。
功能区按按钮组进行组织,以便于查找。例如,在“开始”选项卡上,我们有“字体”、“对齐方式”、“数字”、“样式”等组。有些组(如“样式”和“单元格”)在全屏视图下包含了功能区上所有可用的按钮,但其他功能区组有更多选项,我们可以通过点击组右下角的小箭头图标来访问。例如,在“数字”组中就可以看到这个箭头。
接下来要指出的是屏幕顶部、功能区上方的“快速访问工具栏”。顾名思义,这里可以快速访问你最常使用的工具。可以看到工具栏中已有一些工具,如“保存”、“撤销”、“恢复”、“新建”和“打开”,但我们也可以根据需要添加其他工具。点击工具栏的下拉箭头,然后选择一个常用的工具(例如“升序排序”),它就会被添加进来。我们还可以添加“降序排序”按钮。


现在我们需要熟练地在工作表中移动。你可以简单地使用方向键一次向左、右、上、下移动一个单元格,但也可以使用 Page Down 和 Page Up 键更快地移动,这在数据行数很多时尤其有用。要在大数据表中更快地上下移动,可以使用垂直滚动条。


要左右移动,则使用水平滚动条。同样,在处理大型数据集时,这些滚动条非常有用。
还有一些有用的快捷键可以使用。例如:
Ctrl + Home:返回工作表的起始位置,即单元格A1。Ctrl + End:跳转到工作表中数据的末尾单元格。Ctrl + ↓:跳转到当前列的末尾。Ctrl + ↑:跳转回该列的顶部。
因此,快速找出工作表中数据行数的方法是:定位到数据的第一个单元格,然后按 Ctrl + ↓ 查看最后一行数据。这里可以看到我们有160行数据。现在,如何返回顶部?按 Ctrl + Home 即可。
到目前为止,我们已经了解了如何在工作表及其数据中导航。现在我们需要看看如何选择数据。这非常重要,因为你经常需要选择数据来移动、复制它,或在公式中引用它。
最简单的选择是单个单元格,通常用鼠标或方向键完成。
下一步是选择多个相邻的单元格。这可以通过鼠标从一个单元格拖动到其他相邻单元格来实现,或者使用 Shift 键配合方向键来完成。
接下来是选择单列或单行,只需点击列顶部的字母或行左侧的数字即可。
然后,我们可以通过点击鼠标左键并按住拖动来选择多列或多行。如果你不习惯拖动,也可以先选择第一列,然后按住 Shift 键并按方向键来选择多列,对行的操作同理。
然而,如果你的数据位于不连续(即不相邻)的行或列中,可以先选择第一列,然后使用 Ctrl 键选择另一个不相连的列,例如这里的C列和F列。
你可能需要选择的最大范围是整个工作表,可以通过点击单元格区域的左上角来实现。但这会选中整个工作表,包括所有空行和空列。因此,如果你只想选择工作表中的数据区域,可以使用快捷键 Ctrl + A。
关于在单元格、行和列中选择数据的一个注意事项:在处理选中的单元格时,你可能会看到三种类型的十字形符号。
第一种是选择单元格时看到的大白色十字形,如单元格A4所示。这是我们本视频中一直在使用的“选择”十字形。
第二种是当你将鼠标悬停在单元格底部边缘时看到的、带有箭头的细黑色十字形符号。这是“移动”符号,用于将单元格数据移动到另一个位置。
最后一种是当你将鼠标悬停在单元格右下角时看到的细小黑色十字形。这是“填充柄”或“复制”符号,用于将单元格数据填充或复制到另一个位置。


在本节课中,我们一起学习了如何在电子表格中移动、熟悉了功能区与菜单,并掌握了在工作表中选择数据的方法。在接下来的视频中,我们将讨论如何输入数据、如何复制和粘贴数据,以及如何在电子表格中格式化数据。




005:作为数据分析工具的电子表格 📊


在本节课中,我们将聆听几位数据专业人士的分享,共同探讨使用电子表格作为数据分析工具的优势与局限性。


概述
电子表格(如 Microsoft Excel)是数据分析领域最基础、最广泛使用的工具之一。它界面直观,功能强大,适合处理多种数据分析任务。本节我们将系统了解其核心价值与适用边界,帮助你更有效地在工作中运用它。
上一节我们介绍了数据分析的基本流程,本节中我们来看看电子表格在这一流程中扮演的具体角色。
电子表格的优势 ✅
多位专业人士肯定了电子表格在数据分析中的重要作用。其核心优势在于直观性、易用性和功能的全面性。
以下是使用电子表格进行数据分析的主要优点:
- 数据呈现直观清晰:所有数据都能以表格形式整齐地展现在眼前,数据的格式和内容一目了然,便于进行视觉检查。
- 功能集成全面:电子表格是一个“一站式”工具。日常使用的数据透视表、图表以及各种公式函数(如
INDEX-MATCH、SUMIF)都能在其中完成。例如,使用=INDEX(C2:C100, MATCH("目标", A2:A100, 0))可以快速从大量数据中精确查找信息。 - 处理中小型数据高效:对于数据量在零到两万行左右的数据集,电子表格是理想的选择。通过排序、筛选和创建数据透视表,可以将看似难以管理的大量数据变得清晰可控。
- 普及度高,无需额外工具:电子表格就像通用的沟通语言,无需安装其他复杂软件,即可完成分析、计算乃至报告生成的工作,极大提升了协作效率。
电子表格的局限性 ⚠️

尽管优势显著,但电子表格并非万能。在处理复杂或大规模数据时,它会暴露出一些固有的缺点。


上一节我们了解了电子表格的强大之处,本节中我们来看看它面临的挑战。
以下是使用电子表格进行数据分析时需要注意的局限性:
- 可复现性差:在表格中进行数据清洗(如过滤错误值、填补缺失值)时,操作步骤难以被精确记录和复现。这给团队协作或个人日后追溯分析过程带来了困难。
- 容易陷入“分析瘫痪”:由于功能选项过于繁多,如果不熟悉特定函数,可能会花费大量时间寻找解决方案,反而降低了效率,有时手动处理可能更快。
- 公式稳定性问题:复杂的公式组合(如多层嵌套的
VLOOKUP、IF语句)有时会意外失效,需要重新构建,影响分析工作的稳定性。 - 处理大数据集能力有限:当数据行数超过十万至百万级别时,电子表格的运行会变得缓慢甚至崩溃,这时就需要转向数据库(如 Access)或其他专业工具。
- 复杂分析与展示灵活性不足:对于非常复杂的统计分析或需要高度定制化的交互式数据展示,电子表格的功能显得捉襟见肘。
总结
本节课中,我们一起学习了电子表格作为数据分析工具的两面性。
它的优势在于直观的界面、强大的内置功能以及对中小型数据集的便捷处理能力,是数据分析入门的绝佳工具。然而,其局限性也体现在较差的流程可复现性、处理大规模数据时的性能瓶颈以及复杂分析能力的不足上。
因此,作为一名数据分析师,关键在于根据具体的数据规模和分析复杂度,明智地选择使用电子表格,或是在适当的时候转向更专业的工具。掌握电子表格是基础,了解其边界则能让你走得更远。
006:查看、输入与编辑数据
在本节课中,我们将学习如何在Excel中查看、输入和编辑数据。首先,我们会介绍一些实用的视图功能,然后讲解如何在工作表中输入数据,最后探讨如何对已有数据进行编辑。
🔍 查看数据

上一节我们学习了Excel的基本术语和导航方法,本节中我们来看看如何更有效地查看数据。

当工作表中包含大量数据时,放大查看特定区域会很有帮助。工作表右下角的缩放滑块可以实现这一功能。

以下是缩放操作的两种方法:
- 点击加号或减号按钮。
- 拖动滑块选择所需的缩放比例。

此外,在“视图”选项卡的功能区中,也有一些缩放控制选项:
- 缩放:可以选择预设的缩放级别或自定义比例。
- 100%:将工作表缩放回原始大小。
- 缩放到选定区域:可以先选择一个数据区域,然后仅放大该特定区域。
如果你想在放大的同时查看数据的多个区域,可以使用拆分按钮。这会将屏幕分割成多个部分,每个部分可以单独滚动。如果只需要两个部分,可以通过双击水平或垂直分割线来移除其中一个。
如果你的列有标题行,并且希望在向下滚动工作表时标题行始终可见,你需要使用冻结窗格功能。你可以选择仅冻结首行。如果这不符合需求,例如在本例中,你可以选择要冻结行下方的一行,甚至只是该行中的一个单元格,然后选择“冻结窗格”。对于列,如果你想冻结它们,也可以进行类似操作。你甚至可以同时冻结行和列。这里的技巧是,首先选择一个单元格,该单元格位于你想要冻结行的下一行,并且位于你想要冻结列的右侧一列。在本例中,这个单元格是 C4。现在,我们可以上下左右滚动工作表,同时仍然可以看到标题行以及“制造商”和“型号”列。
现在,如果你打开了多个工作簿,请注意我说的是工作簿而不是工作表,那么你可以使用“视图”->“切换窗口”在它们之间切换。更快的方法是使用 Ctrl + F6 快捷键。
✍️ 输入数据
了解了如何查看数据后,接下来我们学习如何向空白工作表中输入数据。
在Excel中打开新工作表最简单的方法是点击快速访问工具栏中的“新建”按钮,或者如果你更喜欢键盘快捷键,可以使用 Ctrl + N。
让我们在工作表顶部输入一些标题,这通常被称为标题行。请注意,在单元格中输入数据后按 Enter 键,下一个活动单元格是正下方的单元格,但这不是我们当前想要的。如果在单元格中输入数据后按 Tab 键,则会选择同一行中右侧的单元格作为活动单元格。
现在,我们将输入一些标题,并在每个条目后按 Tab 键。
注意,某些单元格中的文本稍长,它要么被下一个单元格部分隐藏,要么与之重叠。如果你想手动调整列宽,可以点击并按住两列之间的分隔线,然后左右拖动。如果你想自动调整,可以双击两列之间的分隔线。由于这些将是我们的列标题,让我们将它们加粗。
现在,让我们在“零件”和“配件”列之间添加一个新列。只需选中这两列中右侧的那一列,然后右键单击并选择“插入”,即可在选定列的左侧插入一个新列。我们将其命名为“维修销售”。
为了同时整理所有列宽,我们选中从A到E的所有列,然后双击任意列之间的分隔线。这将自动减小或增大每列的宽度,以适应该列中的数据。
好的,现在我们有了标题,让我们在A列中输入一些月份数据。如果我们在单元格 A2 中输入“Jan”并按 Enter,它会将我们带到下方的单元格,这正是我们当前想要的。然后我们可以在单元格 A3 中输入“Feb”,依此类推,直到在 A13 中输入“Dec”。
✏️ 编辑数据
输入数据后,有时可能需要修改。假设你需要更改几个标题,有几种方法可以编辑单元格中的现有数据。
以下是编辑单元格数据的几种方法:
- 选中单元格,然后直接开始重新输入。
- 选中单元格,然后按键盘上的
F2键,将光标置于单元格末尾并进行更改。 - 直接在单元格上双击,将光标置于该位置并进行更改。
- 选中单元格,然后在编辑栏中点击以编辑单元格数据。
现在,让我们对“零件”和“配件”列标题进行同样的编辑操作。

📝 总结

在本节课中,我们一起学习了Excel中的一些视图选项,以及如何在单元格中输入和编辑数据。在下一个视频中,我们将学习如何复制和填充数据,以及如何设置工作表中单元格和数据的格式。




007:复制、填充与格式化单元格和数据

在本节课中,我们将学习如何在Excel中移动、复制和填充数据,以及如何格式化单元格和数据以满足分析需求。掌握这些基础操作能显著提升数据处理效率。
🔄 移动与复制数据
上一节我们介绍了Excel的视图功能与数据编辑。本节中,我们来看看如何移动和复制数据。

移动数据时,首先选中单元格区域(例如标题行A1:E1),将鼠标悬停在选区边缘直至出现移动指针,然后拖动至新位置。
若需复制数据,操作类似,但在拖动时需按住Ctrl键,此时会出现复制指针。

如果不习惯拖动操作,也可使用菜单命令或快捷键进行复制粘贴。
以下是具体步骤:
- 选中A列部分数据并复制到剪贴板。
- 选择新位置,粘贴已复制的数据。
数据可在不同工作表间移动或复制。例如,新建一个工作表,从Sheet1选中数据,使用Ctrl+C复制,切换到新工作表后使用Ctrl+V粘贴。


但请注意,默认粘贴操作会沿用目标位置的列宽设置。若想保留源数据的列宽,需在粘贴选项中选择“保留源列宽”。
🧩 使用自动填充功能
手动输入序列数据可能非常耗时。Excel的“自动填充”功能可根据序列或模式自动填充单元格,在处理日期等重复性数据时尤其有用。
例如,在单元格中输入月份(即使是缩写),然后拖动填充柄向下填充,自动填充功能会识别序列并完成填充。
对星期几的操作同理。在单元格中输入“Monday”,拖动填充柄,Excel会按顺序填充星期。
若要创建更复杂的模式,例如每隔一天,则需先输入序列的前两个值(如“Monday”和“Wednesday”),同时选中这两个单元格(A16和A17),再拖动填充柄,Excel将识别出“每隔一天”的模式并完成填充。
核心概念是:使用自动填充时,务必选中所有能定义模式的单元格,以便Excel准确识别。

对于数字模式,情况类似。若在单元格中输入“5”并向下填充,由于缺乏模式,Excel只会复制该数值。
但如果在B2和B3中分别输入“5”和“10”,然后选中这两个单元格并向下填充,Excel将识别出“每次递增5”的模式并完成填充。


🎨 格式化单元格与数据
格式化分为两部分:一是单元格本身的格式(如填充颜色、边框、加粗文本),二是单元格内数据的格式(如文本、数字、货币格式)。
让我们打开之前使用的汽车销售工作表进行实操。
以下是格式化单元格的步骤:
- 选中标题行(A3:P3),可使用鼠标或快捷键
Ctrl+Shift+右箭头。 - 在“开始”选项卡的“样式”下拉菜单中,为单元格选择一种填充颜色,并点击“加粗”。
- 选中“制造商”列的数据,应用另一种样式颜色并加粗。
- 选中“型号”列的数据,应用第三种样式颜色,这次可改为“斜体”,并可调整字体大小和样式。
- 最后,选中所有数据单元格,为其添加边框。
接下来,我们格式化单元格内的数据。
C列和D列的销售数字可格式化为只显示一位小数:选中数据,点击“减少小数位数”按钮。
检查数据时,发现B129和B130单元格本应显示型号(如“9.5”和“9.3”),却被错误识别为日期。这是因为从CSV文件导入时,这两个值被判定为日期而非数字。
解决方法:将这两个单元格的格式设置为“文本”,然后重新输入正确的值“9.5”和“9.3”。
最后,将F列(价格,单位为千美元)格式化为货币。选中F列,在数字格式下拉列表中选择“更多数字格式”,然后选择“货币”选项,并指定正确的货币符号和格式。
📝 课程总结

本节课中,我们一起学习了在Excel中移动、复制和填充数据的多种方法,并掌握了如何对单元格本身及其内部的数据进行格式化,以满足不同的呈现和分析需求。

在下一视频中,我们将开始学习公式基础,了解如何执行简单计算,以及如何选择区域和复制公式。
008:公式基础
在本节课中,我们将学习Excel公式的基础知识,包括公式的构成、如何进行基本计算、如何在公式中选择单元格范围,以及如何复制公式。掌握这些基础是进行高效数据分析的关键。

公式的构成
上一节我们介绍了数据的移动、复制、填充以及单元格和数据的格式化。本节中,我们来看看Excel公式的基本构成。
一个典型的公式由几个关键部分组成。
- 等号:以等号开始,告知Excel你正在该单元格中创建公式。
- 函数:执行计算的部分。例如,
SUM函数用于对引用的单元格或单元格区域中的值进行求和。 - 引用:要包含在计算中的单元格或单元格区域,需要用括号括起来。
- 运算符:指定要执行的计算类型。常见的算术运算符包括:
- 加法:
+ - 减法:
- - 乘法:
* - 除法:
/
- 加法:
- 常量:可以直接输入到公式中且不会改变的数字或值,例如整数
5、百分比10%或日期。
一个典型的公式可能如下所示:
=SUM(B5*20)
这个公式将取单元格B5中的值,然后乘以20。

进行基本计算
了解了公式的构成后,我们开始进行一些基本计算。
假设你需要计算一月份和二月份配件的销售额总和。
- 首先输入等号
=。 - 然后输入要使用的函数,例如
SUM。 - 接着输入左括号
(。 - 选择你的单元格范围,例如
E2:E3。你可以输入E2,E3。 - 最后输入右括号
)并按回车键。
如果你想将三月份的销售额也加进去,就需要将单元格范围扩展到包括E4,即输入E2,E3,E4作为范围。
然而,这种方式非常繁琐且不灵活。因此,有更好的方法:使用冒号:来表示连续范围。例如,E2:E4表示从E2到E4的单元格区域。对于整列,可以输入E2:E13。
更便捷的方法是使用鼠标选择范围:输入=SUM(后,直接用鼠标拖选所需单元格区域,然后按回车,Excel会自动为你补上右括号。
复制公式
完成一列的计算后,通常需要将公式应用到其他列。手动重复输入非常耗时,Excel提供了便捷的复制功能。
以下是复制公式的几种方法:
- 使用填充柄:选中包含公式的单元格,将鼠标移至单元格右下角的填充柄(小方块),当光标变为黑色十字时,按住鼠标左键拖动到目标单元格区域。这称为“自动填充”。
- 双击填充柄:当需要将公式快速填充至一长列数据底部时,双击填充柄,Excel会自动将公式复制到该列所有相邻的单元格中,这是一个节省时间的技巧。
在复制公式时,你会发现公式中的单元格引用会根据新位置自动调整。例如,原本引用E2:E13的公式,复制到旁边一列后,会自动变为引用F2:F13。这种引用称为“相对引用”。
使用自动求和

对于求和这类常见计算,Excel提供了一个更快捷的工具:自动求和。

- 选中要放置求和结果的单元格。
- 在“开始”选项卡的“编辑”组中,点击“自动求和”按钮(Σ)。
- Excel会自动插入
SUM函数并推测求和范围。 - 按回车键确认即可。
“自动求和”按钮旁的下拉箭头还提供了其他常用函数,如平均值、计数、最大值、最小值等。其键盘快捷键是 Alt + =。

总结
本节课中,我们一起学习了Excel公式的基础知识。我们了解了公式的基本构成,包括等号、函数、引用、运算符和常量。我们练习了如何进行简单的计算,并掌握了通过选择范围和利用填充柄、双击填充柄以及自动求和功能来高效复制公式的方法。这些是使用Excel进行数据分析的基石。


在下一视频中,我们将学习数据分析师常用的一些函数,并探索更多高级功能。
009:函数入门
在本节课中,我们将学习Excel函数的基础知识。首先,我们会介绍一些常用的统计函数,然后探索更多数据分析师可能使用的高级函数。通过本课,你将掌握如何利用函数简化计算并提升数据分析效率。

📈 常用统计函数
上一节我们学习了公式基础、基本计算以及如何选择范围和复制公式。本节中,我们来看看如何使用常见的统计函数。
以下是几种常用的统计函数及其应用示例:
- 平均值:计算选定范围内数值的平均值。
- 公式示例:
=AVERAGE(B2:B13)
- 公式示例:
- 最小值:返回选定范围内的最低值。
- 公式示例:
=MIN(B2:B13)
- 公式示例:
- 最大值:返回选定范围内的最高值。
- 公式示例:
=MAX(B2:B13)
- 公式示例:
- 计数:计算选定范围内包含数值的单元格数量。
- 公式示例:
=COUNT(B2:B13)
- 公式示例:
- 中位数:返回选定范围内数值的中间值。如果数值个数为奇数,则返回正中间的值;如果为偶数,则返回中间两个值的平均值。
- 公式示例:
=MEDIAN(B2:B13)
- 公式示例:
操作时,可在“开始”选项卡的“编辑”组中使用“自动求和”下拉列表快速选择这些函数,然后根据需要调整单元格范围,并使用填充柄将公式复制到其他列。
🔍 探索更多函数类别
你已经了解了自动求和和一些常见的统计函数,但Excel还提供了400多个其他函数。现在,让我们探索其中一些类别。
在“公式”选项卡的“函数库”组中,可以找到按类别分组的函数下拉列表:
- 最近使用的函数:列表会根据你的使用情况自动更新。
- 财务函数:用于财务计算,例如
ACCRINT(应计利息)和RATE(利率)。 - 逻辑函数:包含布尔运算符函数,如
AND、IF、OR。 - 文本函数:用于处理文本,例如
CONCAT(连接文本,是旧函数CONCATENATE的更新版)、FIND、SEARCH。 - 日期与时间函数:例如
NETWORKDAYS(工作日天数)、WEEKDAY、WEEKNUM。 - 查找与引用函数:例如
AREAS、HLOOKUP、SORTBY、VLOOKUP。 - 数学和三角函数:包含实用的数学函数如
POWER(乘幂)、SUMIF(条件求和)、SUMPRODUCT(数组乘积和),以及三角函数如COS(余弦)、SIN(正弦)、TAN(正切)。 - 其他函数:提供更多类别,如“统计”、“工程”、“信息”等。
🔎 如何查找所需函数
如果你在这些列表中难以找到想要的函数,可以通过搜索功能来查找。
点击“公式”选项卡上的“插入函数”按钮,然后可以浏览可用类别列表,或选择“全部”并从字母顺序列表中查找。 Alternatively,你也可以直接输入函数名称并点击“转到”进行搜索,然后从返回的结果中选择所需函数。
📝 课程总结

本节课中,我们一起学习了函数的基础知识,包括如何使用数据分析师常用的一些函数,并浏览了Excel中可用的更多高级函数类别。

在下一视频中,我们将探讨公式中的数据引用,特别是相对引用与绝对引用的区别,以及公式中的错误处理。
010:在公式中引用数据



在本节课中,我们将学习Excel公式中引用数据的核心概念。我们将重点探讨相对引用、绝对引用和混合引用的区别与用法,并了解如何处理Excel中常见的公式错误。掌握这些知识对于高效、准确地构建和复制公式至关重要。
🔗 理解引用类型:相对、绝对与混合引用
上一节我们介绍了函数的基本使用,本节中我们来看看如何在公式中引用单元格。理解相对引用和绝对引用的区别是创建公式的关键。默认情况下,Excel中的单元格引用都是相对引用。“相对”一词意味着,当你引用一个单元格时,实际上引用的是该单元格相对于公式所在单元格的位置。
这就是为什么在本课程中,当我们使用复制粘贴或填充柄将公式从一个单元格复制到另一个单元格时,无需修改单元格引用,因为Excel默认你使用的是相对引用。当公式被复制时,单元格引用会自动更改为匹配目标单元格的相对位置。
既然我们已经知道相对引用是Excel的默认设置,那么如何让单元格引用在复制时不发生改变呢?为此,你需要使用绝对引用。与相对引用相反,绝对引用在复制包含此类引用的公式时,引用的单元格保持不变。
最后,在某些情况下,你可能希望单元格引用标识符的一部分是绝对的,而另一部分是相对的。例如,你可能希望行标识符是绝对的,而列标识符是相对的,反之亦然。这被称为混合引用。一个例子是公式 =$A1 + A$3,其中 $A1 具有相对列和绝对行,而 A$3 具有绝对列和相对行。

与相对和绝对引用不同,当你复制包含混合单元格引用的公式时,任何相对单元格引用都会改变,而任何绝对单元格引用在复制的公式中保持不变。
📝 引用类型使用示例
以下是三种引用类型的具体使用示例。
相对引用示例
首先,让我们看一个在公式中使用相对引用的例子。例如,如果我们在单元格E4中输入公式 =A1 + A3。请注意A1和A3单元格被高亮显示,这表示公式中相对引用的单元格。
如果我们使用填充柄将公式复制到正下方的单元格,可以看到结果发生了变化。查看复制的公式,你会发现蓝色和红色的单元格引用已经相对于工作表上的位置发生了改变。公式在复制后变为 =A2 + A4,即每个单元格引用都向下移动了一个单元格。
如果我们将公式复制粘贴到C7,结果同样会改变。复制的公式中,蓝色和红色的单元格引用也再次发生了变化。
绝对引用示例
现在,让我们看一个如何在公式中使用绝对引用的例子。要使单元格引用变为绝对引用,只需在公式中的列和/或行标识符前加上美元符号 $。
例如,如果我们在单元格E4中输入公式 =$A$1 + $A$3。当我们使用填充柄复制公式时,可以看到这次结果保持不变。查看复制的公式,蓝色和红色的单元格引用没有改变,公式仍然是 =$A$1 + $A$3。
同样,如果我们将公式复制粘贴到E7,结果也保持不变,单元格引用同样没有变化。
混合引用示例
最后,我们来看一个如何在公式中使用混合引用的例子。如果我们在单元格G4中输入公式 =A$1 + $A3。

如果我们使用填充柄将公式复制到下方的单元格,可以看到结果发生了变化,但这次的结果与之前的例子不同。查看复制的公式,第一个蓝色的单元格引用保持不变,但第二个红色的单元格引用发生了变化。
如果我们将公式复制粘贴到G7,同样的事情会发生,结果改变。在复制的公式中,第一个蓝色的单元格引用保持不变,而只有红色的单元格引用发生了变化。

⚠️ 处理Excel公式错误
由于编写公式的复杂性,尤其是更复杂的公式,难免会出现语法或数据选择上的错误,从而导致公式错误。错误通常通过在应显示结果的单元格中显示错误代码来标识。
当你看到单元格中出现多个井号 # 时,这并不算真正的错误。它只是意味着列宽不足以显示整个单词或值,或者包含了负的日期或时间值。例如,输入 Ctrl+;,然后空格,再输入 Ctrl+Shift+;,会输入当前日期和时间。但如果单元格太窄,就会显示多个井号。调整列宽后,就能看到单元格内容了。
然而,如果我们在单元格I7中输入公式 =5 x 5,按下回车后,会看到 #NAME? 错误。这个错误是因为试图使用 x 作为乘法运算符,而实际上应该是星号 *。请注意单元格左上角的小绿色三角形。当你选中该单元格时,会出现一个感叹号,提示你错误的原因。在这种情况下,它显示“公式包含无法识别的文本”。
点击感叹号旁边的下拉错误按钮,你会看到几个选项。第一行也提供了关于错误性质的线索,这里显示“无效名称错误”,所以可能是输入了错误的单元格引用、值或函数名。
以下是处理错误的选项:
- 关于此错误的帮助:点击此选项会打开一个帮助窗格,提供与此错误相关的具体信息。
- 显示计算步骤:点击此选项会打开一个对话框,显示当前语法并标出错误,你可以尝试评估错误。
- 忽略错误:如果你确定错误提示不正确,可以选择忽略错误。
- 在编辑栏中编辑:如果你想编辑公式,点击此选项,光标将聚焦在编辑栏中,以便你尝试更正公式错误。
- 错误检查选项:点击此选项会打开Excel选项对话框,定位到与错误检查规则相关的部分,你可以修改这些选项以满足需求。

你犯的每个导致本节开头所列错误代码的错误,都有不同的原因和解决方案。如需了解更多关于这些错误及其典型解决方案的信息,请访问提供的链接。

📚 课程总结

本节课中,我们一起学习了在公式中引用数据。我们重点区分了相对引用、绝对引用和混合引用,并掌握了它们的使用方法。此外,我们还了解了Excel中常见的公式错误及其处理方法。掌握这些引用技巧是构建灵活、准确电子表格的基础,对于数据分析工作至关重要。
011:数据质量介绍 📊
在本节课中,我们将学习数据质量在数据分析中的重要性,并了解评估数据质量的五个关键特征。掌握这些概念能帮助我们确保所使用的数据准确、可靠,从而为业务决策提供有力支持。
数据分析在业务决策和流程中扮演着关键角色。为了利用数据做出正确的决策,我们必须为项目准备正确的信息,且数据必须没有错误。
在本视频中,我们将学习如何通过数据剖析来发现不一致之处。无论我们处理的是小规模数据集,还是分析包含数千行的电子表格,数据分析中最困难的部分之一就是找到并保持数据清洁。为了帮助这一过程并评估数据质量,我们需要关注以下五个特征:准确性、完整性、可靠性、相关性和及时性。

1. 准确性 ✅
准确性是数据质量首要且最重要的方面。数据分析师必须通过删除重复项、纠正格式错误以及移除空行来清理数据集。
2. 完整性 📋
数据质量的另一个重要方面是判断完成数据集所需的信息是否易于获取。为什么这一点很重要?假设我们接到任务,需要计算每个区域的销售总收入。在收集数据后,我们发现没有指定任何区域。那么这些数据将被视为不完整,必须考虑其他来源以获取所需数据。
3. 可靠性 🔍
可靠性是判断数据质量的另一个关键因素。例如,假设我们需要确定按客户划分的代理收入。在收集数据时,我们发现代理们各自保存记录,并不总是将信息更新到共享的公司数据库中。考虑到这些因素,我们会判断共享公司数据库中的数据不可靠,因此需要建立新的流程来确保数据的可靠性。
4. 相关性 🎯
相关性是高质量数据的另一个特征。在收集信息时,数据分析师必须考虑所汇集的数据是否真正为项目所必需。例如,在审查每位客户的销售收入相关数据时,如果其中包含了客户生日等个人信息,早期决定将这些个人信息排除在数据集之外,分析师就能避免审查不必要的信息。
5. 及时性 ⏰
判断数据质量的最后一个因素是及时性。这一特征指的是所选数据的可用性和可访问性。假设我们的销售报告将用于每周的员工评估,但报告每月才更新一次。这种数据刷新错误会导致报告过时,并对员工评估产生严重后果。

总结

在本视频中,我们学习了数据分析师在评估数据质量方面的重要作用。通过考虑高质量数据的五个特征,分析师可以节省时间、避免严重问题,并获得无错误的数据。在下一个视频中,我们将获取收集到的数据,并学习如何将其导入到电子表格中。
012:导入文件数据
在本节课中,我们将学习如何将外部文本文件中的数据导入到Excel中。你将掌握使用文本导入向导处理数据、调整列宽以及增删行列的方法。这些技能对于处理来自不同来源的数据至关重要。

📁 认识文本文件数据
上一节我们讨论了数据质量的重要性,本节中我们来看看如何从文本文件中导入数据。
默认情况下,Excel处理的是 .xlsx 或 .xls 格式的工作簿文件。但Excel也能处理其他格式的数据,例如纯文本文件,或使用逗号、制表符分隔的数据文件。这类文件通常以 .txt 扩展名保存(称为文本文件),或以 .csv 扩展名保存(称为CSV文件)。
以下是一个在记事本中打开的文本文件示例,它包含了汽车销售数据,并使用逗号分隔值(CSV)来分隔每条记录中的各个数据字段。
manufacturer,model,engine size,...
请注意,首行包含诸如“manufacturer”、“model”、“engine size”等标题,每个标题之间用逗号分隔。我们希望这些在导入Excel后成为列标题。

标题行下方是第一行实际数据。同样,每个数据字段也用逗号分隔。该文件共有16个标题,标题下方的每行数据也包含16个字段。
🧙♂️ 使用文本导入向导
要将文件在Excel中打开,请选择 文件 > 打开,然后从最近使用列表中选择文件,或点击“浏览”找到要导入的文件。
打开文件时,文本导入向导会自动启动,并尝试判断文件类型。向导检测到这是一个分隔文件,即数据字段由特定字符(如逗号或制表符)分隔的文件。
由于我们希望文件中的标题行成为Excel的列标题,需要勾选 “我的数据包含标题” 选项。下方的预览框会显示数据的迷你预览。

点击 “下一步” 继续。
在向导的第二步中,需要选择分隔符,即分隔数据字段的字符。我们选择 “逗号” 并取消选择其他选项。此时数据预览会展示导入后的数据样式。
你可以滚动预览窗口,确保数据呈现符合预期。确认无误后,继续向导。
在第三步中,可以为每一列设置数据格式,例如将某列改为文本或日期格式。本例中,我们接受默认的“常规”格式,完成导入向导。
🔧 调整数据布局

数据导入Excel后,文本文件中的标题已成为列标题。但你可能注意到,部分列未能完整显示所有数据:有些标题显示不全,有些数据单元格中只显示一串 ##### 符号。
这是因为某些列的宽度不足。要解决此问题,可以手动调整列宽,也可以批量调整。
以下是调整列宽与行高的方法:
- 调整单列/单行:拖动列标或行号之间的分隔线。
- 批量调整所有列:首先选中所有列(点击列标区域左上角的全选按钮或按
Ctrl+A),然后双击任意选中的列分隔线。 - 自动调整行高:双击行号之间的分隔线。
有时,导入的数据包含不需要的列。例如,我们决定删除“vehicle type”和“latest launch”这两列。
以下是增删行列的操作步骤:
- 删除列:选中要删除的列,在 “开始” 选项卡的 “单元格” 组中,点击 “删除” 下拉菜单,选择 “删除工作表列”。或者,右键点击选中的列,选择 “删除”。
- 添加列:在希望插入新列的位置右侧选中一列,右键点击,选择 “插入”。然后为新列命名,例如“year”。
- 删除行:选中要删除的行,右键点击,选择 “删除”。
- 添加行:在希望插入新行的位置下方选中一行,右键点击,选择 “插入”。
💾 保存为Excel文件
处理完数据后,你可能希望将其保存为标准的Excel文件格式。
有两种方法:
- 选择 文件 > 另存为。
- 或者,点击导入文件时出现在工作表顶部的黄色提示条中的 “另存为”。
在 “另存为” 对话框中,于 “保存类型” 框中选择 “Excel工作簿 (*.xlsx)”。
📝 本节总结


本节课中,我们一起学习了:
- 如何使用文本导入向导导入分隔符格式的文本文件数据。
- 如何通过拖动或双击分隔线来调整列宽和行高。
- 如何通过右键菜单或功能区命令添加和删除行与列。
掌握从外部文件导入并初步整理数据的技能,是进行有效数据分析的第一步。


在下一视频中,我们将讨论数据隐私的重要性,包括敏感信息和个人身份数据的处理。
013:数据隐私基础 🔒

在本节课中,我们将学习数据隐私以及管理所收集数据的相关法规。理解这些内容对于数据分析师至关重要,它能帮助我们避免法律风险并维护客户信任。
数据隐私的重要性与核心原则
当收集客户数据时,有具体的法规规定了这些数据的使用方式。通过理解数据隐私法规并熟悉以下三个基本原则,你可以消除遭受经济处罚的风险并保持客户的信任。
以下是数据隐私的三个核心原则:
- 保密性:这是数据隐私的重要元素,它承认客户的个人信息属于客户本人。
- 收集与使用:必须规范数据的收集方式和用途。
- 合规性:必须遵守所有相关的法律法规。
个人数据的类型
上一节我们介绍了数据隐私的基本原则,本节中我们来看看数据分析师在工作中可能接触到的不同类型个人数据。分析师必须能够识别这些数据。
以下是三种主要的个人数据类型:
- 个人信息:任何可以追溯到特定个人的信息,例如电子邮件或图像。
- 个人可识别信息:可用于识别个人的特定信息,例如社会安全号码或驾驶执照号码。
- 敏感个人信息:此类信息不一定能识别特定个人,但包含需要保护的私人信息,因为如果公开,可能会对个人造成伤害。例如关于种族、性取向、生物识别或遗传信息的数据。
通过理解个人数据及其相关法规,我们可以通过移除不必要的信息来有效地匿名化我们的数据。这类操作有助于建立客户信心,并促进信息的自由流动。
地域与行业特定法规
在筛选数据时,分析师必须了解数据收集公司的所在地以及数据提供者的所在地。了解数据收集地是数据隐私的一个基本要素,也决定了必须适用哪些法规。
以下是几个关键的地域性法规示例:
- 通用数据保护条例:这是欧盟的特定法规,仅适用于欧盟境内的个人管辖范围。
- 巴西通用数据保护法:巴西的一项新法律,适用于巴西境内的个人,而不考虑数据处理者的位置。
- 加州消费者隐私法案:由于美国没有全国统一的数据隐私法,加州制定了此法案以更好地保护客户数据。
此外,还有行业特定的法规来管理敏感和个人数据的收集与使用。例如:
- 在医疗保健领域,HIPAA隐私规则管理受保护健康信息的收集和披露。
- 在零售业,PCI标准管理信用卡数据,未能保护持卡人信息可能导致巨额罚款。
对这些政策有基本了解后,我们就能在处理任何敏感信息时保持合规。不幸的是,客户数据泄露事件屡见不鲜,因此了解如何保持合规至关重要。
合规实践与案例
理解欧盟、美国及其他国家和行业的数据隐私法规是确保数据安全的关键。公司必须始终遵守这些隐私法规,并确保员工能够方便地获取相关政策。
例如,假设一名数据分析师下载了一份包含敏感信息的电子表格。为了在周一早上完成报告,该分析师决定周末将工作笔记本电脑带回家。开车回家后,分析师不小心将笔记本电脑留在了车里。第二天早上,他们发现汽车连同笔记本电脑一起被盗。由于公司有责任保护客户数据安全,当数据离开公司财产时,就构成了隐私泄露。
这种行为不仅可能使公司面临巨额罚款,还可能降低客户信心,从而对收入产生重大影响。
数据匿名化
虽然数据隐私适用于大多数收集的数据,但在某些情况下这些法规并不适用。为了使这些法律和法规不适用,特定的数据收集必须是完全匿名的。
使数据匿名化意味着排除所有能将其与特定个人关联起来的数据。虽然这种方法在所有情况下可能都不切实际,但在收集数据时考虑到隐私问题,可以消除隐私限制,使数据收集更加便捷。

课程总结

本节课中,我们一起学习了数据隐私的重要性,以及数据分析师在收集和筛选数据时可能面临的挑战。我们探讨了个人数据的类型、关键的地域与行业法规,以及通过匿名化保护数据的方法。在下一课的视-频中,我们将学习在电子表格中清洗数据的不同方法。
014:数据质量与隐私的重要性 🔒📊


在本节课中,我们将聆听几位数据专业人士的见解,探讨数据质量和数据隐私在数据分析中的重要性。


数据质量的重要性
上一节我们介绍了课程概述,本节中我们来看看数据质量为何如此关键。数据质量对于数据和分析至关重要。原因在于,一旦你呈现的内容与他人预期不符,他们首先会质疑数据的来源、处理过程以及转换方式。
人们通常认为自己了解业务。当你开始挑战这种认知时,如果你没有高质量、干净且来自可信来源的数据作为依据,就会陷入大量讨论和争论,最终导致你想要传达的核心观点被淹没。
任何成功的数据分析项目的基石都是高质量的数据。计算机科学中有一个常见术语:垃圾进,垃圾出。其核心含义是,如果你输入低质量的数据,就只能得到低质量的结果。
因此,在进行数据分析时,没有什么比确保你使用的是高质量数据更重要了。亲自对数据进行合理性检查,并确信所用数据质量极高,这一点非常重要。
数据准确性高于一切。分析低质量的数据是浪费时间,并且可能误导业务方向。你所使用或提供给他人使用的数据的完整性至关重要。数据被用来决定产品发布的时间或地点,判断某个部门是否盈利。如果不注意细节,很容易混淆事实。
以下是数据质量不佳可能导致的具体问题:
- 决策失误:以库存为例,如果你在SKU级别分析库存,却不小心选错了SKU进行分析,进而得出某个产品不盈利的结论,而事实恰恰相反。这对公司来说是一个重大的决策错误。
- 资源浪费:如果从一开始就使用了有问题的数据,并在此基础上进行构建,后来才发现问题,你将损失时间、精力和努力,在某些情况下还会失去信任。
数据隐私的重要性

了解了数据质量的核心地位后,我们接下来探讨另一个关键议题:数据隐私。数据隐私极其重要,尤其是在制药或医疗保健等行业,但其重要性远不止于此。
我们必须有能力确保用户根据其角色和权限获得相应级别的数据。这可以通过多种方式实现,例如,为每个地区或职能提供特定的数据切片;或者在某些工具(如认知分析工具)中,将其作为模型的一部分进行构建,明确规定谁可以访问什么,无论是精细到“此人可以查看加拿大或美国的数据”,还是简单地控制“此人能否查看完整报告”。
在当今世界,数据隐私是一个重大问题。以税务方面为例,在我们的业务中,有所谓的PII(个人可识别信息),我们必须保护它。因此,我们不能简单地通过电子邮件发送包含此类信息的文件。
我们不会通过电子邮件发送包含敏感PII数据的报税表或任何文件。我们会对其进行加密,确保邮件本身加密,或使用特定软件来隐藏社会安全号码、姓名或出生日期等信息。这些信息会以特定序列呈现,我们通过电话与客户共享该序列,绝不会将其与加密信息放在同一封邮件中,以确保始终安全。我们必须不惜一切代价确保数据受到保护。
课程总结
本节课中,我们一起学习了数据分析和数据管理中的两个基石概念。
- 数据质量是分析有效性的根本。遵循“垃圾进,垃圾出”的原则,使用高质量、准确、干净的数据是得出可靠见解和做出正确商业决策的前提。低质量的数据会导致资源浪费和方向误导。
- 数据隐私是法律和伦理要求。尤其是在处理个人可识别信息时,必须采取严格措施(如加密、权限控制、安全通信等)来保护数据,遵守法规并维护客户信任。
确保数据质量与维护数据隐私,共同构成了负责任且成功的数据分析实践的基础。
015:删除重复或不准确的数据和空行
在本节课中,我们将学习如何处理数据中的不准确信息、删除空行以及移除重复数据。这些操作是数据清洗的基础步骤,能显著提升数据质量,确保后续分析的准确性。
概述

数据在收集或导入过程中,常会出现各种错误和不一致。这些错误可能包括拼写错误、多余空格、大小写不一致、空行、缺失值、不准确或重复的数据。这些问题会导致公式失效、排序和筛选操作失败,进而影响数据可视化和分析结果的呈现。因此,执行数据清洗是提高数据可用性的关键。
检查并修正拼写错误
上一节我们介绍了数据清洗的重要性,本节中我们来看看如何从基础的拼写检查开始。
Excel的拼写检查功能与Microsoft Word等文字处理软件类似。首先,需要选中希望检查的数据区域。
以下是操作步骤:
- 选中包含“产品线”数据的K列。
- 点击“审阅”选项卡中的“拼写检查”按钮。
- 检查完成后,可继续检查其他列,例如包含国家信息的T列。
- 当发现拼写错误时,若认可建议的更正,点击“更改”;也可从列表中选择其他建议,或确认数据无误后点击“忽略”。
- 按此方法,继续检查并修正“交易规模”等列中的拼写错误。
查找并删除空行
处理完拼写问题后,接下来我们需要解决数据中的空行。空行会阻碍数据导航、影响公式计算以及排序筛选功能。
例如,使用 Ctrl + ↓ 快捷键试图跳转到数据列末尾时,光标会在空行处停止,这表明数据集被空行分割成了多个部分。
对于少量数据,可以手动滚动查找并删除空行。但对于海量数据,这种方法效率低下。
以下是利用筛选功能高效删除空行的步骤:
- 使用鼠标或
Ctrl + Shift + End快捷键选中整个数据区域。 - 在“数据”选项卡中,点击“筛选”按钮。
- 点击“客户名称”列(M列)的筛选图标。
- 取消勾选“全选”,然后滚动到列表底部,勾选“空白”项,点击“确定”。
- 此时,表格顶部将只显示所有空行(可通过行号识别,如28、29、65等行会以蓝色高亮显示在顶部)。
- 选中这些空行,右键删除。
- 最后,清除筛选以恢复查看完整数据。
删除空行后,再次使用 Ctrl + ↓ 快捷键即可顺利跳转到数据列末尾。
识别并删除重复数据

清除了空行,数据看起来整洁了一些。但重复的数据行也是常见问题,通常由人工输入错误或导入过程故障导致。
Excel提供了两种删除重复项的方法,第一种方法更安全,因为它允许我们在删除前预览数据。
方法一:使用条件格式标记重复项(推荐)
此方法的关键是选择一个理论上不应出现重复值的列。例如,“销售额”列(E列)比“单价”列更可能具有唯一性。
操作步骤如下:
- 选中“销售额”列(E列)。
- 在“开始”选项卡中,点击“条件格式” -> “突出显示单元格规则” -> “重复值”。
- 点击“确定”后,重复的数值会被标记出来。
- 检查被标记的行,确认是否为需要删除的完全重复条目(例如,发现第74至78行是第36至40行的重复,且属于错误录入)。
- 手动选中并删除这些确认的重复行。
方法二:直接使用“删除重复项”功能
这种方法更简单快捷,但无法在删除前审查具体是哪些行将被移除。
操作步骤如下:
- 选中整个数据表。
- 在“数据”选项卡中,点击“删除重复项”按钮。
- 在弹出的对话框中,取消勾选所有列,然后仅勾选“销售额”列。
- 点击“确定”,Excel将直接删除基于该列判断的重复行。
使用查找和替换修正数据
最后,我们来看一个使用“查找和替换”功能批量修正特定错误的例子。例如,收到客户反馈,其姓氏在订单中被错误拼写。
操作步骤如下:
- 在“开始”选项卡中,点击“查找和选择” -> “替换”。
- 在“查找内容”框中输入拼写错误的姓氏。
- 点击“查找全部”,所有匹配项会列出。
- 在“替换为”框中输入正确的姓氏拼写。
- 点击“全部替换”,即可一次性修正所有错误。
总结
本节课中,我们一起学习了数据清洗的几项核心操作:如何利用拼写检查修正文本错误、如何通过筛选功能定位并删除空行、如何使用条件格式和“删除重复项” 功能两种方式处理重复数据,以及如何运用查找和替换工具批量修正特定错误。掌握这些技能,能有效提升原始数据的质量,为后续的数据分析工作打下坚实基础。


在下一视频中,我们将学习如何统一文本大小写、修正日期格式错误以及清理数据中的多余空格。
016:处理数据中的不一致性 📝
在本节课中,我们将学习如何处理数据中的不一致性问题,包括文本大小写转换、日期格式修正以及清除多余空格。这些技能对于确保数据质量至关重要。
上一节我们介绍了如何处理不准确数据、删除空行和重复行。本节中,我们来看看如何通过改变文本大小写、修正日期格式和修剪数据中的空格来进一步提升数据的一致性。

转换文本大小写 🔠
从不同来源收集或接收数据时,数据中的文本大小写常常不一致。有些是大写,有些是小写,有些是首字母大写(也称为句首大写)。Excel没有像Microsoft Word那样的“更改大小写”按钮,因此需要使用函数来执行此数据清理任务。
以下是用于更改文本大小写的三个主要函数:
UPPER函数:将文本转换为全部大写。LOWER函数:将文本转换为全部小写。PROPER函数:将文本转换为每个单词首字母大写。
使用PROPER函数
假设标题行全部使用大写字符,若想将其转换为首字母大写,需要添加一个辅助行来放置函数。
- 在辅助行(例如A2)中输入公式:
=PROPER(A1) - 按Enter键,A2单元格将显示转换后的结果。
- 要快速将公式填充到多列,可以先选中从A2到目标列(如X2)的单元格区域。
- 按F2将光标聚焦到A2单元格,然后按住Ctrl键并按Enter键,公式将自动填充到所有选中的单元格。
- 复制辅助行的内容,在原始标题行选择“粘贴值”选项。
- 最后,删除辅助行。
使用UPPER和LOWER函数
处理数据列时,通常插入辅助列。
以下是使用UPPER函数将文本从首字母大写转换为全部大写的步骤:
- 在要更改的列右侧插入一个辅助列。
- 在辅助列的第一个数据单元格(例如T2旁的新单元格)输入公式:
=UPPER(T2) - 按Enter键,结果将显示为大写的国家名称。
- 双击填充柄将公式复制到该列的其余部分。
- 复制辅助列的内容,在原始列选择“粘贴值”选项。
- 删除辅助列。
使用LOWER函数将文本转换为小写的步骤与之类似:
- 插入辅助列。
- 输入公式:
=LOWER(K2)(假设K列为产品线数据) - 按Enter键并向下填充公式。
- 复制辅助列的值并粘贴到原始列,然后删除辅助列。
修正日期格式 📅
收到的数据经常混合使用不同的日期格式,或使用不适合您所在区域的格式。Excel允许您轻松更改日期显示方式。
例如,当前日期格式为“DD/MM/YYYY”(英国格式),您想改为美国格式。
- 选中日期单元格,打开“设置单元格格式”对话框。
- 在“区域设置”中,将“英语(英国)”更改为“英语(美国)”。
- 从列表中选择所需的日期格式,例如“March 14, 2012”。
- 点击“确定”应用格式。

若要创建自定义日期格式(如“14 Mar 2012”):
- 在“数字”选项卡中选择“自定义”。
- 选择一个相近的现有格式并进行修改。例如,输入代码:
dd mmm yyyy - 使用格式刷或通过“自定义”格式列表,将此新格式应用到整列。
清除多余空格 ✂️
数据中可能存在多余空格,包括开头空格、结尾空格以及单词间的多余空格。
使用查找和替换功能
此功能适用于清除明显的多余空格,如双空格。
- 选中所有数据。
- 在“开始”选项卡中,点击“查找和选择” -> “替换”。
- 在“查找内容”框中输入两个空格。
- 在“替换为”框中输入一个空格。
- 点击“查找下一个”,然后对每个需要更改的项点击“替换”。若确认所有双空格均需替换,可点击“全部替换”以节省时间。
使用TRIM函数
查找和替换无法安全地移除单词开头和结尾的单空格,否则会误删单词间的合法空格。TRIM函数专用于清除文本首尾的所有空格,并将文本内部的连续空格减少为一个。
- 在需要清理的数据列旁插入一个辅助列。
- 在辅助列的第一个数据单元格输入公式:
=TRIM(M2)(假设M列包含带空格的数据) - 按Enter键,然后双击填充柄将公式复制到该列其余部分。
- 复制辅助列的内容,在原始列选择“粘贴值”选项。
- 删除辅助列。此时,多余空格已被成功清除(修剪)。
本节课中,我们一起学习了如何利用UPPER、LOWER、PROPER函数转换文本大小写,如何调整日期格式以适应不同区域或自定义需求,以及如何结合“查找和替换”与TRIM函数来清除数据中的多余空格。这些操作能有效提升数据的规范性与一致性,为后续分析打下良好基础。


在下一个视频中,我们将讨论如何使用Excel的“快速填充”和“分列”功能来帮助清理数据。
017:用于清洗数据的更多Excel功能 🧹
在本节课中,我们将学习如何使用Excel中的“快速填充”和“分列”功能来帮助清洗数据。上一节我们介绍了如何更改文本大小写、调整日期格式以及修剪数据中的空格。本节中,我们将探讨这两个强大的工具,它们能高效地处理数据拆分与合并任务。
使用“快速填充”合并数据列

“快速填充”功能能识别数据模式并自动填充。在之前的课程中,我们曾简要使用它来快速输入符合特定模式的数据,例如月份或星期名称。它同样可作为数据清洗工具,例如将包含全名的列拆分为“名”和“姓”两列,或修改列中名称的命名约定。
以下是使用“快速填充”将两列姓名合并为一列的操作步骤:
- 首先,插入一个辅助列,可将其命名为“联系人姓名”。
- 在新列的第一行,以您希望的格式输入第一个联系人的全名。例如,可以是“姓, 名”或“名 姓”等格式。本例中,我们使用“名 姓”的标准格式,中间用空格分隔,然后按回车键。
- 接下来,开始输入第二个联系人的姓名。此时,“快速填充”会显示剩余姓名的预览。
- 如果对预览内容满意,只需按回车键,Excel便会自动填充该列中剩余的姓名。
此功能甚至能处理其中一列包含两个名字的情况(例如“Wing C”或“Dauna”)。操作完成后,如果不再需要原始列,可以将其删除。
使用“快速填充”修改命名约定
在上一任务中,我们看到了如何使用“快速填充”将两列数据合并为一列。现在,让我们看看如何使用它来修改列中的命名约定。
- 切换到目标工作表(例如“客户联系人”工作表)。
- 在下一列(例如B列)的第一个数据行(B2单元格)中,键入第一个联系人的姓名,使用您想要的任何命名约定(例如“姓, 名”),然后按回车键。
- 同样,当我们在下一行(B3单元格)开始输入第二个联系人姓名时,“快速填充”会检测到模式,并在我们按回车键后自动填充B列中剩余的姓名。

之后,您可以复制粘贴列标题,并删除原始的A列。
注意:“快速填充”无法将包含两个名字的单个列拆分为两个单独的列。要完成此操作,我们需要使用“分列”功能。
使用“分列”功能拆分数据
顾名思义,“分列”功能可以将包含多部分文本的列拆分为一个或多个其他列。这与“快速填充”不同。这对于将任何多部分文本(如姓名或地址)拆分为单独的组成部分非常有用。

以下是使用“分列”功能拆分姓名的步骤:
- 打开目标工作表(例如“客户联系人”工作表)。
- 为接下来的两列添加列标题,并复制第一列标题使用的单元格格式,然后调整列宽。
- 选择A列中从A2到A23的数据。
- 在“数据”选项卡上,单击“分列”,这将启动向导。
- 在向导的第一页,确保选择“分隔符号”。
- 在第二页,确保仅选择“空格”作为分隔符。
- 在向导的第三页,单击“目标区域”旁边的小箭头,在工作表上选择B2单元格,然后单击小箭头返回向导。至此,向导设置完成。
现在,您可以看到A列中的完整客户联系人姓名已成功拆分为B列和C列中的两个新列。如果不再需要A列,可以将其删除。
使用函数实现相同效果
您也可以使用函数实现相同的结果。如果您使用的是Excel网页版(在线版本),这将非常必要,因为该版本没有“分列”功能。此外,使用函数提供了更大的灵活性,这在处理复杂和混合的姓名时尤其有用(例如包含连字符的姓名、有些有中间名、有些有两个中间名首字母、有些没有中间名首字母)。
以下是使用函数拆分姓名的示例步骤:
- 再次打开“客户联系人”工作表。
- 为接下来的两列添加列标题,复制第一列标题的单元格格式,并调整列宽。
- 在B2单元格中输入公式以提取名字部分。例如,公式
=LEFT(A2, 5)可以从A2单元格的左侧开始提取5个字符(包括空格)。 - 在C2单元格中输入公式以提取姓氏部分。例如,公式
=RIGHT(A2, 7)可以从A2单元格的右侧开始提取7个字符。 - 双击B2单元格的填充柄,使用“自动填充”完成该列。
- 对C2单元格的填充柄执行相同操作,以完成该列的填充。
总结


本节课中,我们一起学习了如何使用Excel中的“快速填充”和“分列”功能来帮助清洗数据。我们探讨了如何利用“快速填充”合并列或修改数据格式,以及如何使用“分列”功能将单列数据拆分为多列。此外,我们还了解了在特定情况下如何使用函数替代“分列”功能来完成数据拆分任务。掌握这些工具将大大提高您处理和组织数据的效率。
018:数据质量问题 👁️🗨️
在本节课中,我们将聆听几位数据专业人士围绕数据质量问题的讨论,了解低质量数据带来的挑战以及数据清洗的重要性。

概述
数据质量是数据分析工作的基石。低质量的数据会导致分析结果不准确,甚至引发错误的商业决策。本节我们将通过专业人士的亲身经历,理解数据质量问题的常见表现、影响以及确保数据质量的最佳实践。
数据质量问题的普遍性与影响
多位专家指出,处理低质量数据是数据分析工作中的常态。一位在医疗保健领域工作的分析师提到,其大部分时间都花在了数据清洗和验证上。
人类无法被标准化校准。两个人面对相似的情况,看法可能略有不同。因此,需要由我来确保,如果一个人将某物描述为“海军蓝”,而另一个人描述为“深蓝色”,我会将其统一为“蓝色”。
这个例子说明,在分析之前,必须检查信息的完整性,以确保结果的准确性。现实世界中,没有数据是完美的。数据通常为最广泛的目的而收集,但往往存在缺失,或格式不符合特定分析需求的情况。
数据清洗与转换的必要性
以下是数据清洗中常见的活动:
- 格式标准化:例如,将日期和时间从单个字段中拆分出来,以便按日、月、季度进行分析。
- 数据验证:确保所有数据已被正确捕获,例如,某个月份的收入数据是否完整。
- 逻辑一致性检查:在财务分析中,需核实所有成本是否与所分析期间相关,数据在方向上是否正确。
通过这些清洗和转换活动,可以使数据变得具体、可用,并符合你的工作方式。
低质量数据的具体案例与后果
一位有财务背景的专业人士分享了其经历:在审查财务报表、计算利润率时,低质量数据会带来严重问题。
如果数据不正确或不属于当期,就需要对存储数据的总账进行调整,以正确反映实际情况。
低质量数据会引发不必要的讨论,导致你对自己的分析产生怀疑,无法坚定、可靠地呈现你的案例和数据。这会直接影响决策的效率和信心。
应对策略与最佳实践
如果遇到数据质量问题,可以采取以下几种应对策略:
- 追溯源头:回到数据源头,确保源数据被正确提取。
- 明确记录:使用类似知识目录的工具,清晰、直接地记录对数据所做的所有转换或更改,并向受众展示这些过程。
- 及时修正:在筛选和排序数据时,如果发现错误,必须返回修正。否则,本可用于其他工作的时间就被浪费了。
不断重做或重复数据的某些部分,会使数据完整性受到质疑,并且坦白说,如果习惯性地这样做,会令人感到沮丧。
总结

本节课中,我们一起学习了数据质量在数据分析中的核心地位。我们了解到,低质量数据普遍存在,可能导致分析错误、决策延误和信任危机。通过注重细节、在早期进行数据清洗和验证、并清晰记录数据处理过程,可以显著提升数据质量,从而节省时间,增强分析结果的可靠性和说服力。确保良好的数据质量,是每位数据分析师高效、准确工作的基本保障。
019:使用电子表格分析数据介绍

在本节课中,我们将学习如何对已收集和清洗的数据进行分析。我们将重点讨论筛选、排序、执行计算以及重塑数据的重要性,以从中提取有意义的信息。
决定如何操作数据有时可能具有挑战性。在进行任何更改或调整之前,我们需要先设想最终输出的结果。以下是开始分析任务前需要考虑的几个问题:数据集有多大?需要何种筛选才能找到必要信息?数据应如何排序?需要进行何种类型的计算?
既然我们已经设想了最终输出,接下来就必须决定塑造数据的最佳方法。最基础的步骤是筛选和排序数据。

通过排序,我们可以根据特定条件(如字母顺序或数字大小)来组织数据。
例如,如果我们想检查是否存在重复的订单号,可以通过排序数据来快速发现重复项。在排序并删除重复行之后,我们发现视图需要更具体以满足需求。
现在我们决定只查看十一月份的数据。通过添加筛选器,我们可以选择只显示月份ID等于11的数据行。通过筛选数据,我们现在只能看到符合筛选条件的行,这有助于我们更好地分析信息。

熟悉所有数据分析工具可能看起来令人望而生畏,但使用电子表格的一个关键优势是能够使用函数。
Excel中的函数按多个类别组织,包括数学、统计、逻辑、财务以及日期和时间函数。假设我们想计算公司六月份的平均收入。
我们意识到有超过100个项目需要计算。在正常情况下,要计算平均值,我们必须创建一个公式来将每一行相加,然后除以总行数。这种计算不仅非常冗长,还可能使分析人员容易出错。

通过使用函数,我们可以简化计算,只需一步即可完成:=AVERAGE(B1:B160)。
虽然单独在电子表格上排序和筛选数据很有用,但首先将数据转换为表格具有更多优势。当我们将数据转换为表格时,能够更高效地筛选和计算数据。
一个例子是能够轻松计算列的总和。对于“MSRP”列,我们选择“求和”,就能快速计算出该列的总和。
如果我们随后查看数据,并且只想计算基于“日本”的MSRP总和,我们可以筛选“国家”列,使其仅显示日本。这样,该列将只累加与日本相关的行中的值。
虽然并非所有数据都适合放入表格,但将数据格式化为表格有相当多的优点:自动计算、筛选时列标题不会消失、使用交替行颜色使阅读更轻松、添加新行时表格会自动扩展。
有时,数据需要比基本表格格式更高级的组织方式,而创建数据透视表及其图表可能是分析和展示所需信息的更好方法。
在Excel中,我们可以选择创建数据透视表来显示和分析数据,并可选择性地创建关联的数据透视图。例如,假设我们想知道十月份有哪些公司从原始数据表中订购了产品。
我们创建一个数据透视表来组织和分析所需数据,同时创建一个数据透视图来展示信息。然后,通过将月份筛选器添加到新创建的数据透视表中,我们不仅可以在表格中看到十月份的结果,而且这些更改会自动更新到数据透视图中。
当需要从大型数据集中提取特定信息时,数据透视表是一种很好的方式,可以只显示所需的信息。这使我们能够快速、轻松地浏览关键信息。
数据透视图是数据透视表的有力补充,因为它们允许我们以视觉方式处理数据,并且在大多数情况下,能让观众更快地掌握信息。选择使用数据透视表和图表的好处包括:无需使用公式即可操作数据、快速汇总大型数据集、能够展示引人入胜的图表和图形。


在本节课中,我们学习了筛选、排序、执行计算以及重塑数据以提供有意义信息的重要性,并了解了一些开始分析数据的工具。在下一个视频中,我们将更深入地学习如何筛选和排序数据。
020:在Excel中筛选和排序数据
在本节课中,我们将学习如何使用Excel的筛选和排序功能来控制工作表中显示哪些信息以及如何显示这些信息。掌握这些技能能帮助你更高效地查看和分析数据。
🔍 数据筛选
上一节我们介绍了如何使用“快速填充”和“分列”功能来清理数据。本节中,我们来看看如何通过筛选功能,仅显示符合特定条件的数据行。
筛选功能让你能更灵活地控制数据在工作表中的显示范围。它通过设定标准和参数来缩小数据视图,有助于提升数据的可读性,并方便你查找特定信息。

以下是启用筛选功能的步骤:
- 在 “数据” 选项卡中,点击 “筛选” 按钮。
- 点击后,每个列标题旁都会出现一个小的筛选图标。
补充说明:
- 若只想对特定列启用筛选,请先选中这些列,再点击“筛选”按钮。
- 如果将数据区域设置为 表格,筛选控件会自动添加到每一列。
现在,每一列都可以应用筛选器。例如,在“订单日期”列可以按年份筛选,在“产品线”列可以按产品类型筛选,在“客户名称”列可以按客户姓名筛选。
让我们先按年份筛选,仅显示2004年的订单:
- 点击“订单日期”列的筛选图标。
- 在列表中,取消勾选其他年份,仅保留“2004”。
此时,查看工作表底部的状态栏,你会发现现在仅显示了114条记录中的50条。
若要清除筛选,有两种方法:
- 点击该列筛选图标,选择 “从…中清除筛选”。
- 或在筛选列表中勾选 “全选”。
接下来,我们筛选“产品线”列,仅显示“经典汽车”的销售数据,然后清除该筛选。最后,筛选“客户名称”列,仅显示对“Many Gifts Distributors Ltd.”的销售记录,之后同样清除筛选。
目前我们只应用了单一筛选。但假设你想进行更精细的筛选,可以同时启用多个筛选条件。例如,我们可以同时筛选出“2004年”、“经典汽车”产品线、且客户为“Many Gifts Distributors Ltd.”的所有销售记录。
请注意:
- 若只想清除单个筛选,点击该列标题的筛选按钮,选择“从…中清除筛选”。
- 若要快速清除所有筛选,可以使用 “数据” 选项卡下 “排序和筛选” 组中的 “清除” 按钮。
⚙️ 自定义筛选
到目前为止,我们使用的是通常被称为“自动筛选”的功能。但你也可以使用“自定义筛选”为文本或数字数据指定更复杂的筛选条件。
例如,如果你想查看销售额高于或低于特定值的订单,可以使用自定义筛选。
对“销售额”列应用数字筛选,仅显示超过2000美元的销售记录:
- 点击“销售额”列的筛选图标。
- 选择 “数字筛选” -> “大于”。
- 在弹出的对话框中输入
2000。
查看状态栏,现在显示了114条记录中的111条。
清除该筛选,然后反向操作,筛选出销售额低于2000美元的订单。可以看到,只有3个订单低于2000美元。

重要提示: 被筛选隐藏的数据行并未被删除,它们仍然存在,只是暂时不可见。这一点可以通过左侧蓝色的行号来确认:行号从69开始,并以较大间隔跳跃,表明数据集中存在比当前显示更多的数据行。
清除所有筛选。对于包含文本的列,其筛选菜单项会变为 “文本筛选”,并提供多种文本筛选选项,如“包含”、“开头是”、“结尾是”等。
若要完全关闭工作表的筛选功能,只需再次点击 “数据” 选项卡中的 “筛选” 按钮即可。


🔄 数据排序
现在,让我们来看看Excel的基本排序功能。排序是数据分析师工作中的重要环节。通过将文本数据按字母顺序、数字数据按数值大小、日期数据按时间先后进行排序,可以使数据更易于理解和分析,并以更有意义的方式呈现。
排序时,首先需要选择要排序的数据范围。以下是几种常见的排序操作:
- 按客户名称字母排序: 先选中“客户名称”列中的一个单元格,然后点击 “升序” 或 “降序”。
- 按销售额数值排序: 先选中“销售额”列中的一个单元格,然后点击 “升序” 或 “降序”。
- 按订单日期时间排序: 先选中“订单日期”列中的一个单元格,然后点击 “升序” 或 “降序”。
🎯 多级排序
你还可以同时按多个列进行排序,这称为多级排序。
- 选中数据区域内的任意单元格。
- 在 “数据” 选项卡中,点击 “排序” 按钮。
- 在弹出的“排序”对话框中:
- 在 “主要关键字” 下拉列表中选择第一排序列,例如“订单日期”,并在 “次序” 中选择“升序”。
- 点击 “添加条件” 按钮,添加次要排序级别。
- 在新增的 “次要关键字” 下拉列表中选择第二排序列,例如“销售额”,并在 “次序” 中选择“降序”。
- 如果数据包含标题行(本例中即是),请确保勾选 “数据包含标题” 复选框。
- 点击 “确定” 开始排序。
执行上述操作后,数据将首先按订单日期从早到晚排序。对于同一订单日期的多条记录,则会再按销售额从大到小进行排序。
📝 总结

本节课中,我们一起学习了如何使用Excel的筛选和排序工具来控制工作表中信息的显示内容和显示方式。筛选功能帮助你聚焦于符合特定条件的数据子集,而排序功能则能按逻辑顺序组织数据,使其更清晰、更易于分析。掌握这些基础操作是进行有效数据分析的重要一步。
021:筛选与排序的重要性
在本节课中,我们将聆听几位数据专业人士讨论筛选和排序数据的重要性。为什么筛选和排序数据如此关键?
🎯 概述

筛选和排序是数据分析和可视化过程中的重要环节。它们能帮助你从单一数据视图中提取特定信息,并让他人能够基于此进行自主分析。
🔍 排序的作用与方式
上一节我们提到了筛选和排序的整体重要性,本节中我们来看看排序的具体含义。
排序通常指将数据按特定顺序排列,例如从高到低、按字母顺序,或者进行自定义排序。
以下是几种常见的排序方式:
- 从高到低:例如按销售额降序排列。
- 字母顺序:例如按客户名称A-Z排列。
- 自定义排序:例如将自家产品或特定项目排在列表前列。
自定义排序非常实用,你可以将重点产品置顶,或将直接竞争对手的数据分组显示,以便进行对比分析。
⚙️ 筛选的功能与价值
了解了排序后,我们进一步探讨筛选。筛选功能让我能够深入数据核心。
通过筛选,我可以快速聚焦于特定数据子集,而无需逐行浏览大量信息。
例如,我可以轻松查看某个客户在特定时间段内的收入,或其在特定时期内的盈利情况。
筛选和排序能帮助你缩小数据范围,精准定位,直接找到所需答案,避免被无关的海量数据干扰。
📈 筛选在可视化中的应用
当我们谈论筛选时,通常指依据特定值来查看对应的数据。
这个概念在数据可视化中同样适用。例如,假设我们有一个显示月度销售额的柱状图。

如果我想查看特定地区或特定产品线的销售额,我可以应用筛选功能。
这样,图表将只显示与所选地区或产品线相关的销售数据,使分析更加聚焦和清晰。
✅ 总结
本节课中,我们一起学习了筛选和排序在数据分析中的重要性。排序帮助我们有逻辑地组织数据,而筛选则使我们能快速提取和聚焦于关键信息。两者结合是进行高效、精准数据分析的基础技能。
022:用于数据分析的有用函数 📊
在本节课中,我们将学习Excel中几个对数据分析至关重要的函数:IF、IFS、COUNTIF和SUMIF。这些函数能帮助我们根据特定条件进行逻辑判断、计数和求和,从而更高效地处理和分析数据。
上一节我们介绍了如何使用筛选和排序工具来控制工作表中信息的显示。本节中,我们来看看如何运用函数来执行更复杂的逻辑和数据计算。
首先,让我们了解如何使用 IF 函数。
IF 函数是Excel中最常用的逻辑函数之一。它允许你将一个值与设定的标准进行逻辑比较,然后根据比较结果是真(TRUE)还是假(FALSE)来返回相应的结果。这些结果可以是文本值或数值。
IF 函数的基本逻辑是:如果某个条件成立,则返回一个值(或执行一个操作);如果不成立,则返回另一个值(或执行另一个操作)。
以下是 IF 函数的基本语法:
=IF(logical_test, value_if_true, value_if_false)
例如,在我们的“车辆玩具销售”工作表中,如果想添加一列来记录订单是否已发货,可以执行以下操作:
- 在现有列右侧添加新列,命名为“已发货”。
- 在单元格H2中输入公式:
=IF(G2=“已发货”, “是”, “否”)。这个公式的意思是:如果G2单元格的文本是“已发货”,则返回“是”;否则返回“否”。 - 然后使用填充柄将此公式复制到整列。
我们还可以用 IF 函数来强调订单的规模。例如,添加一个名为“3K以上/以下”的列,并输入公式:=IF(F2>3000, “超过3K”, “低于3K”),以标记销售额是否超过3000。
在理想情况下,IF 函数只用于应用一两个条件。但有时你可能需要应用多个条件。这时,可以利用函数的嵌套功能,将多个 IF 语句组合在一个公式中,这被称为嵌套 IF 函数。
例如,要按销售额将订单分为“大”、“中”、“小”,可以使用如下嵌套公式:
=IF(F2>5000, “大”, IF(F2>2000, “中”, “小”))
这个公式包含多个 IF 函数,每个条件对应一个,因此需要多组括号,相对较长且复杂。
尽管Excel技术上支持在一个公式中嵌套多达64个不同的 IF 函数,但这并非推荐的最佳实践。在单个公式中使用多个 IF 函数会使其变得极难管理和理解,尤其是当公式由他人创建或长时间未使用时。此外,如果条件增加,就需要向本已复杂的公式中添加更多条件,这只会让事情变得更糟。


为了解决这个问题,Excel引入了一个新函数:IFS。IFS 函数仅在 Excel 2019、Microsoft 365 版 Excel 和 Excel 网页版中受支持。
顾名思义,IFS 函数可以替代单个公式中使用的多个嵌套 IF 函数,从而简化问题。使用 IFS 函数重写上面的订单大小分类公式如下:
=IFS(F2>5000, “大”, F2>2000, “中”, TRUE, “小”)
这个公式只有一组括号,使用一个函数就清晰表达了所有条件。
现在,让我们看另一个结合 IF 函数和条件格式的示例。
切换到“汽车销售”工作表,在“年转售价值”列右侧添加新列“残值率”,输入公式 =G2/F2(用年转售价值除以原始零售价),并将其格式设置为百分比。然后复制到整列。


接下来,添加一列来突出显示每辆车的残值表现。在H2单元格输入公式:=IF(G2>0.69, “良好”, “不佳”)。如果残值率大于69%,则标记为“良好”,否则标记为“不佳”。再次复制公式到整列。

我们还可以使用条件格式来进一步突出显示这些“良好”或“不佳”的标签。
- 选中H2单元格,在“开始”选项卡中点击“条件格式”->“新建规则”。
- 选择“只为包含以下内容的单元格设置格式”。
- 设置条件为:单元格值等于“良好”。
- 将格式设置为深绿色字体和浅绿色填充。
- 将此条件格式复制到整列。
- 再次打开“条件格式”->“管理规则”,添加一个新规则,条件为单元格值等于“不佳”,格式设置为红色字体和粉色填充,并应用到整列。

现在,所有标记为“良好”和“不佳”的单元格都通过颜色被清晰地区分出来。
接下来,我们快速了解如何使用 COUNTIF 函数。
COUNTIF 是Excel提供的统计函数之一,用于计算满足特定条件的单元格数量。例如,统计员工姓名在销售发票列表中出现的次数,或特定零件号在采购订单列表中出现的次数。
以下是 COUNTIF 函数的基本语法:
=COUNTIF(range, criteria)

假设你想知道“车辆玩具销售”工作表中,有多少销售订单的客户位于英国。我们在单元格AD7中输入公式:=COUNTIF(C2:C100, “United Kingdom”)。请注意,当使用文本作为条件时,必须将文本用引号括起来。结果显示有6个英国订单。
同样,要查找法国客户的数量,可以编辑公式为:=COUNTIF(C2:C100, “france”)。注意,这次输入的文本是小写,但函数仍然有效,因为此函数中的名称不区分大小写。结果显示有14个法国订单。美国客户的订单数则为41个。
还有一个较新的函数叫 COUNTIFS,它可以对多个区域应用条件,并统计所有条件均满足的次数。这避免了在单个复杂公式中使用多个 COUNTIF 函数的需要。COUNTIFS 函数同样仅在 Excel 2019、Microsoft 365 版 Excel 和 Excel 网页版中受支持。

现在,让我们看看如何使用 SUMIF 函数,这是Excel中非常常用的数学函数。
SUMIF 函数用于对指定范围内满足特定条件的值进行求和。例如,你只想汇总超过特定水平的工资,或者想找出某个特定产品类别的总销售额。

以下是 SUMIF 函数的基本语法:
=SUMIF(range, criteria, [sum_range])
我们在单元格AD10中输入公式:=SUMIF(F2:F100, “>3000”)。这个公式将汇总所有销售额超过3000美元的订单。再次注意,因为使用了算术运算符(大于号),所以必须将条件用引号括起来。如果条件只是一个数字,则不需要引号。计算结果显示,所有超过3000美元的订单总额接近470,000美元。
你还可以在搜索部分匹配时使用通配符,如问号(?)和星号(*)。此外,你可以指定从与条件列不同的列中提取值进行求和。
例如,输入公式:=SUMIF(B2:B100, “*cars”, E2:E100)。这个公式将对E列(销售额)中,所有B列(产品线)以“cars”结尾的产品对应的销售额进行求和。

同样,也有一个较新的函数叫 SUMIFS,可用于根据多个条件对单元格求和。这避免了在单个复杂公式中使用多个 SUMIF 函数的需要。SUMIFS 函数也仅在 Excel 2019、Microsoft 365 版 Excel 和 Excel 网页版中受支持。


本节课中,我们一起学习了 IF、IFS、COUNTIF 和 SUMIF 这几个核心函数在Excel数据分析中的应用。它们能帮助我们基于条件进行逻辑判断、数据计数和汇总,是处理复杂数据集的强大工具。在下一视频中,我们将探讨如何使用 VLOOKUP 和 HLOOKUP 这两个引用函数。
023:使用VLOOKUP与HLOOKUP函数 📊
在本节课中,我们将学习如何使用Excel中的VLOOKUP和HLOOKUP这两个重要的查找与引用函数。它们能帮助你在表格中快速查找并返回所需的数据。
上一节我们介绍了IF、COUNTIF等逻辑与统计函数,本节中我们来看看如何利用查找函数连接不同表格中的数据。
VLOOKUP函数:垂直查找
VLOOKUP是Excel中最常用的引用函数之一,它代表“垂直查找”。当你需要在一个表格或区域中按行查找数据时,这个工具非常有用。

VLOOKUP的工作原理是,利用源数据和查找表之间的一个共享关键值进行匹配。一个典型的VLOOKUP公式结构如下:
=VLOOKUP(lookup_value, table_array, col_index_num, [range_lookup])
以下是公式中各个参数的含义:

lookup_value:查找值。即你想要查找的值或词语。table_array:查找表或区域。即包含查找值的单元格区域。公式中,Excel将其引用为table_array。查找表可以位于同一工作表或另一个独立的工作表中。col_index_num:列索引号。即查找表中包含你所需返回值的列序号。公式中,Excel将其引用为col_index_num。[range_lookup]:这是一个可选参数,决定匹配是精确匹配(用FALSE表示)还是近似匹配(用TRUE表示)。公式中,Excel将其引用为[range_lookup]。参数周围的方括号表示它是可选的,而其他参数是必需的。如果在公式中不指定此参数,默认值为FALSE,即要求精确匹配。你也可以用数字0代替FALSE,用数字1代替TRUE。
现在,让我们看看VLOOKUP函数的实际应用。
在“汽车销售”工作表中,假设我们想快速生成一份心仪汽车的价格列表。首先,我们需要将包含查找值的列放在最左侧,因为VLOOKUP函数要求如此。然后,我们可以删除原始列。
接着,我们在单元格V16中输入公式。该公式在单元格A2到G156的表格数组中查找“Corvette”这个词,然后在包含“Corvette”的行中查找第五列(即价格列)的值,并返回精确值$45705。
请注意,在这个例子中,我们使用了现有数据表的一部分作为查找表或表格数组。
让我们将其格式设置为美元货币,并保留零位小数。实际上,与其在公式中使用引用A25,不如使用工作表中我们心仪汽车列表小表格里“corvette”这个词的引用(即V5),这样更方便,公式同样有效。
现在,让我们将公式复制到工作表中上方的心仪汽车表格里。但出现了问题:复制公式时,单元格引用发生了变化。这是因为,正如我们在本课程前面学到的,单元格引用的默认状态是相对的,而在这个案例中,我们需要它们是绝对的。
让我们撤销复制操作。为了使单元格引用变为绝对引用,我们需要在公式中的所有单元格引用前添加美元符号$。这可以手动完成,也可以将光标依次放在公式中的每个单元格引用上,然后按F4键自动添加美元符号。
让我们再次尝试复制公式。这次,它成功了。
如果我们使用单元格W5的填充手柄将其向下复制到其他汽车行,它没有正常工作。实际上,每个单元格都得到了相同的结果。为什么?因为每个公式都引用了查找值中的相同单元格,因为我们使用了绝对引用。现在,我们只需要修改公式,仅移除查找值部分中行参数的绝对引用(即删除美元符号)。

因此,在单元格W5中,我们将$V$5改为$V5。然后,当我们向下拖动填充手柄时,公式将被正确复制,所有价格都会更新以反映其正确的零售价。
最后,为了展示这两个表格现在通过VLOOKUP函数连接起来了,如果我们在主数据表的单元格E25中更改雪佛兰科尔维特的零售价,心仪汽车价格列表中的价格也会随之改变。
HLOOKUP函数:水平查找
现在让我们看看HLOOKUP函数。正如前面提到的,它的功能与VLOOKUP函数几乎相同,但它是按列查找数据,而不是按行。
HLOOKUP在表格的顶行中查找一个词或值,然后从表格数组中指定的行返回同一列中的值。因此,如果你的比较值位于数据表顶部的行中,你会使用HLOOKUP。相反,如果你的比较值位于你想要查找的数据左侧的列中(如上一个任务那样),你会使用VLOOKUP。
在这两个函数中,由于大多数数据表的性质,VLOOKUP的使用频率远高于HLOOKUP。


HLOOKUP的语法与VLOOKUP相同,只是你指定的是行索引号(公式中Excel引用为row_index_num)。这表示查找表中包含你所需返回值的行号。
让我们在主数据表右侧创建一个小型查找表。为了便于查看,此工作表中隐藏了几列。

现在,我们的查找表顶行有了“低HP”、“中HP”和“高HP”。接下来,我们将添加Wingdings符号作为三个马力等级的评级:1个悲伤表情代表低马力,2个中性表情代表中等,3个笑脸代表高马力。
现在,让我们在“HP等级”列右侧添加一个新列,命名为“HP评级”。然后在单元格L2中输入HLOOKUP函数。此函数将查找单元格K2中的值(本例中为“中HP”),并在单元格范围Y21到AA22(即我们的小查找表)中查找它,然后返回它在表中“中HP”下方第2行找到的答案,并使用精确值。注意,我们在此公式中使用了一些绝对引用。
现在返回的是文本“KK”,因此我们需要使用Wingdings字体格式化该单元格。当我们双击填充手柄时,整列将显示与每行HP等级值相关的HP评级符号,这样就完成了。
关于XLOOKUP函数
尽管VLOOKUP和HLOOKUP仍然是Excel中查找引用的常用函数,但有一个更新的函数叫XLOOKUP。此版本仅在Excel桌面版(从Microsoft 365版开始)、Excel网页版、Excel for iPad/iPhone以及Excel for Android平板电脑/手机上受支持。
XLOOKUP是VLOOKUP和HLOOKUP的改进和结合版本。它可以在任何方向(垂直或水平)工作。它还使用独立的查找数组和返回数组值,而不是单一的表格数组和列/行索引号。

总结

本节课中,我们一起学习了如何在Excel中使用VLOOKUP和HLOOKUP函数,在垂直和水平的查找表中查找并连接数据。在下一课的后续视频中,我们将开始学习在Excel中使用数据透视表。
024:在Excel中创建数据透视表介绍
在本节课中,我们将学习如何在Excel中创建和使用数据透视表。我们将首先了解如何将数据格式化为表格,然后学习如何创建数据透视表,并利用字段来分析数据。最后,我们将探讨如何在数据透视表中执行计算。
拥有一个充满信息的工作表固然重要,但要真正从中获取价值,我们需要从不同角度分析数据,以找到与数据相关问题的答案。
之前我们已经使用了筛选器和公式等功能来对数据进行数学和逻辑分析,但并非所有问题都能仅通过筛选器和公式轻松解答。
为了获得可用且易于呈现的数据洞察,我们需要借助另一种工具——数据透视表。数据透视表为电子表格提供了一种简单快捷的方式来汇总和分析数据,从而观察数据中的趋势和模式,并进行数据比较。
数据透视表是动态的。因此,当您更改或向数据透视表所基于的原始数据集添加数据时,分析和汇总信息也会随之更新。
数据分析师可以使用数据透视表来得出有用且相关的结论,并创建对组织数据的洞察,以便向公司内部的相关方展示这些洞察。
在Excel中开始创建数据透视表之前,首先将数据格式化为表格会非常有帮助。这样做不仅是为了让数据更有组织、更清晰,并为其添加表格样式,更重要的是,在向数据集添加记录时,这会变得容易得多。
在汽车销售工作表中,我们首先选择数据内的任意单元格。然后,在“开始”选项卡的“样式”组中,选择“格式化为表格”。接着,从库中选择一种样式。请注意,Excel会自动识别我们数据范围的边界,但如有需要,我们可以更改此范围。同时,请确保选中“我的表包含标题”(如果确实包含的话)。
点击“确定”后,数据已被格式化为表格。请注意每列顶部的筛选下拉箭头,这些在您将数据格式化为表格时会自动添加。
如果我们现在滚动到表格底部,并开始为另一辆车添加一行新数据,当您按下Tab键或Enter键时,请注意新行会自动被格式化并包含在我们的表格中。
现在,让我们看看如何创建一个基本的数据透视表,以及如何使用字段在数据透视表中排列数据。
在开始之前,您应该使用一个检查清单来确保您的数据处于适合创建数据透视表的状态。以下是清单内容:

- 为获得最佳效果,请将数据格式化为表格。
- 确保列标题正确无误,并且只有一个标题行,因为这些列标题将成为数据透视表中的字段名称。
- 删除任何空行和空列,并尽量消除空白单元格。
- 确保值字段格式为数字,而非文本。
- 确保日期字段格式为日期,而非文本。
在工作表中,我们只需选择表格内的任意单元格。然后,在“插入”选项卡上,点击“数据透视表”。请注意,在“选择一个表或区域”框中,已经为我们输入了表名“表1”。如果我们没有事先将数据格式化为表格,则需要在此处指定单元格区域。
接下来,我们需要决定是在一个新的空白工作表上创建数据透视表,还是在当前工作表上创建。默认选项是新建工作表,这也是最常用的选项。因此,一个新的空白工作表会打开,在工作表左侧的图形中显示一些基本的数据透视表说明,右侧则显示数据透视表字段窗格。
如果您愿意,可以为数据透视表所在的工作表重命名。
要构建数据透视表报告,我们需要将数据透视表字段窗格顶部的某些字段添加到底部窗格的一个或多个区域中。例如,如果我们想找出每种车型的总销售额,我们可以将“制造商”字段拖到报告的“行”区域,然后将“型号”字段也拖到那里。
但这并不是我们想要的样子。因此,我们将“制造商”字段拖到“行”区域的顶部,位于“型号”之上,这样更符合我们数据的逻辑。
接下来,我们将“价格”字段添加到“列”区域。但这同样不是我们想要查看数据的方式。因此,我们将“价格”字段拖到“值”区域,这样更合理,看起来也更好。
接着,我们也将“单位销量”字段添加到“值”区域。现在,我们可以看到每种型号的单独价格以及每种型号的单位销量。
让我们将“车辆类型”字段添加到“列”区域,但这似乎不太有用。因此,让我们移除该字段,这可以通过两种方式完成:要么使用下拉菜单,或者如果我们撤销上一步操作,也可以通过简单地将字段拖出“列”区域来实现,可以拖到左侧的工作表区域,也可以拖到上方字段列表的顶部。
现在,让我们看看如何在数据透视表中执行一个简单的计算。如果我们查看数据透视表中的“价格总和”列,可以看到这些数字的格式是“常规”。因此,首先让我们将这些数字的格式更改为美元货币。

这可以通过修改数据透视表字段窗格相应区域中该字段的“值字段设置”来完成。我们将该字段格式设置为美元,并且不显示小数位。
接下来,我们将从“数据透视表分析”选项卡使用“字段、项目和集”按钮添加一个计算字段。我们希望这个字段通过将价格乘以单位销量来计算每个型号的总销售额。
当我们创建并添加这个公式时,它会作为一个名为“总型号销售额”的字段添加到数据透视表字段窗格中。我们可以再次更改其格式为美元。
现在,工作表中的数据透视表里出现了一个名为“总型号销售额总和”的新列。在第5行,我们可以看到Acura Integra型号的销售额已超过3.6亿美元。在第7行,我们可以看到Acura TL型号的销售额已超过10亿美元。
在本节课中,我们学习了如何将数据格式化为表格,如何创建数据透视表并使用字段分析数据,以及如何利用数据透视表数据执行计算。

在下一个视频中,我们将探讨数据透视表的其他一些功能。
025:透视表观点分享 👥

在本节课中,我们将聆听几位数据专业人士分享他们使用数据透视表分析数据的经验。数据透视表是Excel中一个强大的工具,能够帮助我们从海量数据中快速提取关键信息。通过他们的实际案例,我们可以更好地理解透视表在数据分析工作中的价值和应用场景。
专业人士的经验分享
以下是几位数据专家对使用数据透视表的看法和体验。
-
经验丰富的日常使用者:我在Excel中使用数据透视表的经验非常丰富,并且一直在使用。需要记住的是,你可以轻松地进行求和、求平均值和计数。你可以设置按字段分组,让他人能在顶部选择参数。如果你有几千条甚至Excel能处理的所有记录,数据透视表都是一个非常简单的操作方式,无需进行任何实际的查询或使用开发语言。
-
**电商数据分析师**:我曾处理过一个庞大的电商销售数据集。我需要分析关键绩效指标,包括商品交易总额和佣金率。然而,如果只停留在宏观层面,我只能获得有限的洞察。借助数据透视表,我能够按国家、商店类型、产品类型对数据进行分组,这使我能够从不同粒度查看数据并分析关键绩效指标。 -
审计领域的应用:我在工作中使用数据透视表,尤其是在审计过程中,它能协助并帮助我们深入挖掘数据。因为数据透视表的作用是帮助你处理大量数据,并将其提炼成有意义的信息。以审计为例,一个客户可能有价值50万美元的维修保养账单,由300美元的发票组成。我们不想查看每一张每一美元的发票,我们想看的是高额发票。因此,我们将使用数据透视表来筛选出那些对财务报表实际影响最大的发票。
-
快速理解数据的工具:可以说,Excel数据透视表是快速有效理解数据的好方法。能够直接打开一个Excel表格,将其放入数据透视表,通过拖放操作来感知数字的样貌和数值,这确实能帮助你很好地理解数据,以便开始构建更稳健的分析。能够理解字段的含义和表现形式,这些都能在项目初期帮助你进行分析。数据透视表对于快速查看数据、从多个层面审视数据非常有用,而且方式快捷清晰。在一组原始数据上创建数据透视表,按某个感兴趣的层级(例如国家、用户所在国家、用户加入年份或其他任何维度)进行聚合,这非常简单。它非常适合快速查看和理解隐藏在数据中的一些更高级别的摘要信息。

总结
本节课中,我们一起学习了数据专业人士如何利用数据透视表解决实际数据分析问题。从日常的汇总统计,到复杂的电商KPI多维度分析,再到审计中的关键信息筛选,数据透视表以其拖拽式的便捷操作和强大的分组聚合能力,成为快速洞察数据、提升分析效率的必备工具。掌握它,你就能在数据海洋中更快地找到方向。
026:数据透视表进阶功能
在本节课中,我们将学习数据透视表的一些进阶功能,包括“推荐的数据透视表”、筛选器、切片器以及时间线。这些工具能帮助你更高效地分析和探索数据。
上一节我们介绍了如何创建和使用基础的数据透视表。本节中,我们来看看如何利用Excel提供的其他功能来增强数据透视表的分析能力。
🔍 推荐的数据透视表

“推荐的数据透视表”并非一个独立的功能,它更像是一个根据你选中的数据,智能推荐不同数据组合的列表。如果你对创建数据透视表经验不足,这是一个极佳的起点。
以下是其工作原理:
- 在“车辆玩具销售”工作表中,若我们选中包含“订单数量”数据的B列,然后从“插入”选项卡选择“推荐的数据透视表”,系统会提供一系列与订单数量相关的潜在数据组合。
- 如果选中包含“订单规模”信息的F列,推荐的列表则会相应变化,反映该数据。
- 选中包含“销售额”的E列时,推荐的透视表则与销售数据相关。
我们选择列表中的第三个选项:“按区域汇总的销售额”,这听起来能通过数据透视表获得有价值的洞察。
请注意,系统会新建一个工作表来放置这个推荐的数据透视表,同时右侧会打开“数据透视表字段”窗格。我们可以将工作表重命名为更有意义的名称。
在字段窗格中,可以看到一些字段已被自动添加到“行”和“值”区域。即使是推荐生成的透视表,我们仍可以自定义它,例如通过拖拽将“产品线”字段添加到“列”区域。现在,透视表中就为摩托车、轮船、火车等每条产品线都创建了单独的列。
在数据透视表中,我们可以手动展开任意字段以查看其内容。例如,可以看到订单日期位于区域名称之下,这与字段窗格中“行”区域的字段顺序一致。我们也可以手动折叠字段,或者使用“展开整个字段”和“折叠整个字段”选项一次性操作。
🎯 数据透视表筛选
数据透视表的筛选功能与我们在课程前期使用的标准筛选器工作原理基本相同。
以下是筛选操作方式:
- 注意,此透视表已内置了一些筛选功能。例如,“行标签”标题本身就是一个筛选器,我们可以像使用标准筛选器一样,筛选出特定区域(如日本)的数据。清除筛选也非常简单。
- 我们还有一个“列标签”筛选器,允许我们筛选此透视表中的任何产品线项目,例如仅显示“火车”产品的数据。
- 此外,我们还可以将“产品线”字段作为标准筛选器使用,方法是将其拖拽到字段窗格的“筛选器”区域。然后,它就可以像课程前期那样作为标准筛选器使用。此筛选器也允许选择多个项目,但因为它现在是标准筛选器而非列标题,我们无法看到不同产品线的数据拆分,只能看到合并的总计。而作为列标题时,每个产品线的信息会单独显示在各列中。
让我们再次显示所有字段总计,并将“产品线”字段拖回之前的“列”区域,以便在透视表中看到不同产品线的数据拆分。
🎛️ 切片器
切片器本质上是屏幕上的图形化筛选对象,允许你通过按钮来筛选数据。它们使快速筛选数据透视表数据变得容易,并能直观显示当前的筛选状态,让你一目了然地知道当前显示和隐藏了哪些数据。
以下是使用切片器的步骤:
- 首先,将“产品线”字段从数据透视表字段窗格中拖出以移除它。
- 然后,在“数据透视表分析”选项卡中,点击“插入切片器”,并选择“区域”字段作为我们的切片器。
- 切片器可以自由移动到工作表的任何位置,它包含了EMEA、北美、日本等每个区域名称的按钮。
- 如果需要,可以点击“多选”按钮来筛选多个区域。点击“清除筛选器”按钮可以清除所有切片器筛选。
让我们为“产品线”字段再添加一个切片器。但请注意,务必先选中数据透视表中的一个单元格,否则“插入切片器”按钮可能无法使用。切片器也可以从“插入”选项卡的“筛选器”组中添加。
这次我们选择“产品线”字段作为切片器,并将其拖到工作表顶部附近。和之前一样,我们可以选择单个项目,也可以开启多选并选择多个项目进行筛选。
清除切片器筛选后,现在让我们同时使用两个切片器进行筛选。请注意,在使用多选筛选时,选择一个项目实际上是将其筛选出来,即定义哪些项目不显示在数据透视表中。这与在切片器中单选项目的行为相反。
现在,我们仅显示EMEA和北美区域中,经典汽车、火车以及卡车和巴士产品的数据。让我们清除这些筛选,并将“产品线”字段放回数据透视表的“列”区域,为接下来要探索的功能做好准备。同时,将这些切片器移到工作表下方以免碍事。

📅 时间线
时间线是另一种筛选工具,专门用于筛选数据透视表中与日期相关的数据。这是一种比在日期列上创建和调整筛选器更快捷、更有效的动态日期筛选方式。

我们可以从“数据透视表分析”选项卡或“插入”选项卡为数据透视表添加时间线。再次提醒,请确保先选中数据透视表中的任意单元格。
以下是时间线的使用方法:

- 我们选择“订单日期”字段作为时间线筛选器。
- 将其拖到工作表上方并放大。
- 此时间线默认按月显示数据,但你也可以按天或按季度筛选。
- 你可以选择单个季度,也可以选择一个季度范围。例如,我们可以选择2003年第三季度到2004年第二季度之间的12个月。
- 使用“清除筛选器”按钮可以清除时间线筛选。
- 你也可以按年份筛选,例如,这里我们仅选择了2003年。
你可以在一个数据透视表中组合使用切片器和时间线作为筛选器。例如,我们可以用切片器筛选,仅显示EMEA和北美区域的火车产品数据,同时用时间线筛选仅显示2003年的数据。如果我们将时间线筛选改为2004年,会发现没有数据显示,这意味着在2004年,EMEA或北美区域都没有火车产品的销售记录。
当你选中时间线或切片器时,功能区会出现它们专属的选项卡,你可以修改其属性以改变外观和工作方式。例如,可以将时间线改为浅绿色,将切片器改为橙色。最后,要删除时间线或切片器,可以选中后按Delete键,或右键点击并选择“剪切”。
📝 总结

本节课中,我们一起学习了Excel中可与数据透视表配合使用的一些进阶功能,包括推荐的数据透视表、筛选器、切片器以及时间线。这些工具极大地提升了数据交互分析和可视化的效率与灵活性,是进行深入数据分析的得力助手。
027:《数据分析Excel基础》|课程介绍
在本节课中,我们将要学习IBM数据分析师专业证书第二门课程《数据分析Excel基础》的整体内容与学习目标。这门课程旨在帮助你掌握使用Excel电子表格进行数据分析的基础技能,包括数据清洗、整理与分析的核心操作。
🎯 课程概述
这门IBM课程旨在帮助你使用Excel,并为数据清洗与分析打下坚实基础。数据清洗与分析是成为数据分析师所需技能组合的重要组成部分。
你不仅将学习使用电子表格进行数据分析的技术,还将在整个课程中通过多个动手实验进行实践。
📚 课程模块详解
上一节我们介绍了课程的整体目标,本节中我们来看看课程的具体模块安排。
模块 1:电子表格基础


在模块1中,你将学习电子表格的基础知识。
以下是该模块涵盖的核心内容:
- 电子表格术语
- 界面介绍
- 在工作表和工作簿中的导航操作
模块 2:数据处理基础
掌握了基础操作后,模块2将深入数据处理的核心功能。
以下是该模块涵盖的核心内容:
- 选择数据
- 输入与编辑数据
- 复制与自动填充数据
- 格式化数据
- 使用函数与公式,例如求和公式
=SUM(A1:A10)
模块 3:数据清洗与整理
理解了如何操作数据后,模块3将专注于数据清洗与整理。
以下是该模块涵盖的核心内容:
- 数据质量与数据隐私基础
- 删除重复和不准确的数据
- 删除空行
- 消除数据不一致和空格
- 使用快速填充和分列功能
模块 4:数据分析
完成数据清洗后,模块4将教你如何使用电子表格分析数据。
以下是该模块涵盖的核心内容:
- 筛选数据
- 排序数据
- 使用常见的数据分析函数
- 创建与使用数据透视表
- 创建与使用切片器与时间线
模块 5:实战项目
在课程最后的模块5中,你将完成一系列动手实验,指导你如何创建作为数据分析师的第一个交付成果。
以下是项目涉及的关键步骤:
- 理解业务场景
- 清洗和准备数据
- 分析数据

🔄 课程实践方式
在整个课程中,你将跟随两个不同的业务场景,每个场景使用其自己的数据集。这些不同的场景和数据集将用于课程视频和动手实验。
✅ 学习成果
完成本课程后,你将能够达成以下目标:
以下是完成课程后你将掌握的能力:
- 理解电子表格如何作为数据分析工具使用。
- 理解何时使用电子表格作为数据分析工具及其局限性。
- 创建电子表格并解释其基本功能。
- 使用Excel执行数据整理和数据清洗任务。
- 使用Excel电子表格中的筛选、排序和数据透视表功能分析数据。
- 执行一些中级水平的数据整理和数据分析任务来解决业务场景。
🤝 学习支持
课程团队和其他学员可以在课程讨论论坛中提供帮助,以防你需要任何协助。
让我们开始下一个视频,你将在其中获得对电子表格的介绍。

本节课中我们一起学习了《数据分析Excel基础》课程的整体框架、五个核心模块的内容、实践方式以及完成课程后能够获得的关键技能。接下来,我们将进入具体的学习环节。
028:电子表格简介
在本节课中,我们将介绍电子表格的基础知识。我们将列举一些常见的电子表格应用程序,了解电子表格的核心功能,并讨论为什么电子表格是数据分析师的有用工具。

🖥️ 常见的电子表格应用程序
市场上有多种电子表格应用程序可供选择。其中一些比其他应用程序更广为人知和使用,有些是免费的,而另一些则需要付费。
目前,最常用且功能最全面的电子表格应用程序是 Microsoft Excel。其桌面版本作为 Office 套件和部分 Microsoft 365 订阅的一部分,需要付费使用。同时,还有一个名为 Excel for the web(也称为 Excel online)的网页版简化版本。在线版本对拥有 Microsoft 帐户的用户免费,但不提供桌面版本的所有高级功能。
其次最流行的是 Google Sheets。它提供了许多(虽然不是全部)Excel 的功能,并且对拥有 Google 帐户的用户免费。这是一个基于网页的应用程序,能很好地与 Google 表单、Google Analytics 和 Google Data Studio 等其他 Google 应用集成。
此外,还有 LibreOffice Calc。这是一个完全免费、开源的桌面电子表格应用程序,其功能比 Excel 或 Google Sheets 更基础,但仍然包含许多数据分析所需的工具,例如图表、条件格式和数据透视表。
其他电子表格应用程序还包括:
- Zoho Sheet:一个功能齐全、可与 Google Sheets 媲美的网页版应用程序。
- OpenOffice Calc
- Quip for Salesforce
- Smartsheet:主要用于项目管理。
- Apple Numbers:随 Mac 电脑等 Apple 设备提供,也可在 App Store 上为其他 Apple 设备下载。
因此,您有许多电子表格应用程序选项,从功能齐全到基础版,从云端应用到桌面应用,从付费版本到免费版本。您可以根据自己的需求和预算来决定使用哪一款。
🔑 电子表格的核心功能
上一节我们了解了有哪些电子表格软件,本节中我们来看看电子表格的核心功能。电子表格相对于手动计算方法有几个优势。
例如,一旦您正确编写了公式,就可以确保计算是准确的,并且计算会自动为您执行。电子表格还有助于保持数据的有序性和易于访问性。您的数据可以轻松地进行格式化、筛选和排序以满足需求。
如果您在数据输入或计算中出错,可以轻松地编辑、撤销或使用错误检查工具来纠正这些错误。最后,您可以在电子表格中分析数据,并创建图表、图形和报告,以帮助可视化您的数据分析。
自 20 世纪 70 年代 VisiCalc 在 Apple II 个人电脑上问世以来,电子表格软件在功能和特性方面已经取得了长足的进步。从简单的表格和相对基础的计算,发展成为用于分析、管理和可视化海量数据集的强大工具。
💼 电子表格的常见用途



了解了电子表格的强大功能后,我们来看看它在实际中有哪些应用。电子表格最常见的商业用途包括以下内容:
以下是电子表格在商业中的常见应用列表:
- 数据录入与存储
- 比较大型数据集
- 建模与规划
- 图表制作
- 识别趋势
- 业务流程流程图
- 跟踪业务销售
- 财务预测
- 统计分析
- 损益会计
- 预算编制
- 法务审计
- 薪资与税务报告
- 开具发票
- 日程安排
除了商业用途,其他典型用途还包括:
- 个人开支管理
- 家庭预算
- 食谱库
- 健身追踪
- 卡路里计数与体重监测
- 体育联赛(如梦幻足球)管理
- 音乐库编目
- 甚至包括联系人列表、购物清单和圣诞贺卡清单
📈 数据分析师如何运用电子表格
作为数据分析师,您可以将电子表格用作数据分析任务的工具,包括:

以下是数据分析师使用电子表格的主要环节:
- 收集与获取数据:从一个或多个来源收集和获取数据。
- 清理数据:清理数据以移除重复项、不准确之处、错误,并解决缺失值问题,从而提高数据质量。
- 分析数据:通过筛选、排序和解释数据,以确定可以从数据中获取哪些有用信息。
- 可视化数据:帮助您向关键业务利益相关者及组织内任何其他相关方讲述数据分析发现的故事。

✅ 课程总结
本节课中,我们一起学习了电子表格的简介。我们了解了一些常见的电子表格应用程序、电子表格的主要功能以及为什么电子表格可能是数据分析师的有用工具。

在下一个视频中,我们将学习电子表格的基础知识,包括常见的电子表格术语。
029:电子表格基础(第一部分)
在本节课中,我们将开始学习使用电子表格应用程序的基础知识。我们已经了解了可用的电子表格软件以及为何电子表格是数据分析师的有用工具,现在让我们深入探讨一些基本操作。
我们将使用完整桌面版的Excel进行演示,但所涉及的大部分任务同样可以在Excel Online及其他电子表格应用程序(如Google Sheets)中完成。
📚 基础术语介绍
首先,我们来了解一些基础的电子表格术语。

当您打开Excel时,可以选择创建一个新的空白工作簿或打开一个现有的工作簿。我们将选择“新建”一个“空白工作簿”。


工作簿是Excel中的最高层级组件,以 .xlsx 文件形式存在。因此,当您打开或创建一个工作簿时,实际上就是在操作一个 .xlsx 文件。

工作簿包含了您的所有数据、计算和函数,并由多个底层元素构成。
📄 工作表与标签
一个工作簿由一个或多个工作表组成,每个工作表在Excel中由一个标签页表示。
每个工作表都有一个名称,默认显示在对应的标签页上,例如 Sheet1、Sheet2 等。为了使工作表标签更具意义,通常会对它们进行重命名,以更好地反映工作表的目的。
以下是重命名工作表的方法:
- 右键单击标签页,选择“重命名”。
- 或者,直接双击工作表标签页的名称进行重命名。
工作表标签可以命名为任何符合您特定需求的名称,以便于理解该工作表所代表的内容。
请注意,当前被突出显示的工作表标签所对应的工作表,被称为活动工作表。
🔀 调整工作表顺序
如果您想以不同的方式排列工作表,操作非常简单。

您可以通过拖动工作表标签页到左侧或右侧,并将其放置在由小黑箭头指示的位置来完成。如果您不习惯拖放操作,也可以通过以下步骤实现:
- 右键单击工作表标签。
- 选择“移动或复制”。
- 在“下列选定工作表之前”的列表中,选择您希望放置该工作表的位置。
- 点击“确定”。
📍 单元格、行、列与引用
每个工作表都由大量称为单元格的矩形框组成。这些单元格将包含您的数据,数据可以是文本、数字、公式或计算结果。
单元格按列(垂直向下,使用字母系统,例如B列)和行(水平向右,使用数字系统,例如第7行)进行组织。
每个单元格由一个单元格引用表示,它本质上是列字母和行数字的组合。例如,如果我们点击工作表中心附近的某个位置,现在选中的是单元格 M20。这通常被称为活动单元格。


活动单元格不仅通过单元格高亮边框指示,而且在工作表的左上角,您会看到其单元格引用被记录在一个小方框中(显示为 M20)。
需要记住的一个重要点是,单元格引用总是先列后行,即先写列字母(M),再写行号(20)。
🔲 单元格区域
工作簿中我想提到的最后一个元素是单元格区域。它标识了多个被一起选中的单元格集合。

这个集合可以是同一行或同一列的几个单元格,也可以是几行和几列的组合。您可以通过鼠标操作(选中第一个单元格,然后向下或向右拖动以包含其他单元格)或使用 Shift 加方向键来选择单元格区域。
这个单元格范围通常被称为数组,最常用作计算和公式中的引用。例如,如果您想对D9到D19单元格之间的所有值求和,您可以在公式中指定这个单元格区域。
请注意,单元格区域使用单元格引用之间的冒号来标记。因此,在这个例子中,它将是 D9:D19。要指定同一行中的几个单元格,可能是 D9:H9。要选择多行和多列,可能是 D9:H19。我们将在后续课程中开始学习计算和公式时看到这种表示法的应用。
这些单元格区域甚至可以引用另一个工作表中的单元格,这通常被称为三维引用。
现在我们可以关闭这个工作簿,本视频中无需保存它。

🎯 本节总结
在本视频中,我们学习了电子表格元素的一些基本术语,包括工作簿、工作表、单元格、单元格引用和单元格区域。



在下一个视频中,我们将讨论如何在电子表格中导航、如何使用功能区与菜单以及如何选择数据。
030:电子表格基础(第二部分)📊

在本节课中,我们将学习如何在Excel工作表中移动、熟悉功能区与菜单,并掌握选择数据的方法。这些是高效使用Excel进行数据分析的基础操作。

上一节我们介绍了工作表的基本构成元素,本节中我们来看看如何在实际操作中驾驭一个工作表。
要打开示例文件,我们点击“文件”。这会打开后台视图,在这里可以创建新工作簿、打开、保存或打印工作簿,也可以访问Excel选项。现在我们要打开示例文件,因此点击“打开”,然后从“最近使用的文件”列表中选择,或点击“浏览”来查找所需的数据文件。
我们首先应该熟悉功能区与菜单。请注意,顶部的功能区包含多个选项卡。其中一些选项卡(如“开始”、“插入”、“视图”)可能在其他Office产品中很熟悉,而另一些(如“公式”、“数据”、“Power Pivot”)可能是新的。
为了给自己腾出更多工作空间,我们可以通过双击任意选项卡来隐藏功能区;要取消隐藏,执行相同操作。另一个选项是使用快捷键 Ctrl + F1。

功能区被组织成按钮组以便查找。例如,在“开始”选项卡下,有“字体”、“对齐方式”、“数字”、“样式”等组。其中一些组(如“样式”和“单元格”)在全屏视图下包含了功能区上所有可用按钮,但其他组有更多选项,可通过点击组右下角的小箭头图标来访问,例如这里的“数字”组。
接下来要指出的是屏幕顶部、功能区上方的“快速访问工具栏”。顾名思义,这里可以快速访问最常用的工具。可以看到工具栏中已有一些工具,如“保存”、“撤销”、“恢复”、“新建”和“打开”,但我们也可以根据需要添加其他工具。点击工具栏的下拉箭头,然后选择一个常用工具(如“升序排序”),它就会被添加进来。我们也可以添加“降序排序”按钮。

现在我们需要熟练地在工作表中移动。
以下是移动工作表的基本方法:
- 可以使用方向键一次向左、右、上、下移动一个单元格。
- 也可以使用
Page Down和Page Up键更快地移动,这在数据行数很多时特别有用。 - 要在大型数据表中更快地上下移动,请使用垂直滚动条。
- 要左右移动,请使用水平滚动条。在处理大型数据集时,这些滚动条非常有用。
还有一些有用的快捷键:
Ctrl + Home:返回工作表的起始位置,即单元格A1。Ctrl + End:跳转到工作表中数据的末尾单元格。Ctrl + 向下箭头:跳转到当前列的末尾。Ctrl + 向上箭头:跳转回该列的顶部。
快速找出工作表中数据行数的方法是:定位到数据的第一个单元格,然后按 Ctrl + 向下箭头 查看最后一行数据。这里可以看到我们有160行数据。要返回顶部,按 Ctrl + Home 即可。
到目前为止,我们已经了解了如何在工作表及其数据中导航。现在我们需要看看如何选择数据。这非常重要,因为经常需要选择数据来移动、复制或在公式中引用。
以下是选择数据的不同方法:
- 选择单个单元格:通常用鼠标点击或使用方向键完成。
- 选择多个相邻单元格:可以用鼠标从一个单元格拖拽到其他相邻单元格,或者使用
Shift键配合方向键进行选择。 - 选择单列或单行:只需点击列顶部的字母或行左侧的数字。
- 选择多列或多行:点击鼠标并按住拖拽过更多列;如果不习惯拖拽,也可以先选择一列,然后按住
Shift键并使用方向键选择多列,对行同样适用。 - 选择不连续的行或列:如果数据位于不相邻的行或列,可以先选择第一列,然后使用
Ctrl键选择其他不相连的列,例如这里的C列和F列。 - 选择整个工作表:可以点击单元格区域的左上角。但这会选中整个工作表,包括所有空行和空列。
- 仅选择工作表中的数据区域:可以使用快捷键
Ctrl + A。
关于在单元格、行和列中选择数据的一个警告:在处理选中的单元格时,可能会看到三种类型的十字形符号。
以下是三种十字形符号的含义:
- 第一种是选择单元格时看到的大白色十字,如单元格A4中所示。这是我们在本视频中一直使用的“选择”十字。
- 第二种是当鼠标悬停在单元格底部边缘时看到的、带有箭头的细黑十字形符号。这是“移动”符号,用于将单元格数据移动到另一个位置。
- 最后一种是当鼠标悬停在单元格右下角时看到的细小黑色十字。这是“填充柄”或“复制”符号,用于将单元格数据填充或复制到另一个位置。



在本节课中,我们一起学习了如何在电子表格中移动、熟悉了功能区与菜单,并掌握了在工作表中选择数据的方法。在接下来的视频中,我们将讨论如何输入数据、如何复制和粘贴数据,以及如何在电子表格中格式化数据。
031:4_06 观点——将电子表格作为数据分析工具 📊




在本节课中,我们将聆听几位数据专业人士的讨论,了解将电子表格作为数据分析工具的优势与局限性。
概述
本节内容将分为两部分:首先探讨使用电子表格进行数据分析的优点,然后分析其缺点与限制。我们将通过专业人士的实际经验,帮助你全面理解电子表格在数据分析中的适用场景。
电子表格的优势 ✅
上一节我们介绍了课程主题,本节中我们来看看使用电子表格进行数据分析的主要优点。多位专业人士分享了他们的积极体验。
以下是使用电子表格作为数据分析工具的主要优势:
- 数据呈现清晰直观:电子表格能将所有数据清晰地以表格形式呈现出来。任何查看电子表格的人都能清楚地了解数据内容及其格式,便于进行直观的视觉检查。
- 功能强大且全面:以微软Excel为例,其数据透视表、图表等功能,以及公式(如专业人士偏爱的
INDEX-MATCH函数)都非常实用。它是一个“一站式”工具,能执行计算、分析财务比率,并能从ERP系统导出报告进行自定义。 - 适用于中小型数据集:对于数据量大约在0到20,000行之间的数据集,电子表格是一个很好的选择。它能有效帮助用户梳理数据,例如从上千条交易记录中汇总客户月收入。
- 化繁为简的管理能力:通过排序、筛选、美化数据以及使用数据透视表,可以将看似难以管理的海量数据变得易于掌控。关键在于将庞杂的数据分解为可管理的部分。
- 普及性与易用性:电子表格是分析和呈现数据最简单的方式之一,无需任何复杂的工具或额外软件。它就像一种通用的沟通语言。



电子表格的局限性 ⚠️
了解了电子表格的优势后,接下来我们看看其另一面。使用电子表格进行数据分析也存在一些明显的缺点和挑战。
以下是使用电子表格作为数据分析工具的主要局限性:
- 可复现性差:在电子表格中分析数据的一个主要缺点是很难复现操作步骤。例如,当你加载数据、筛选异常值或填补缺失值时,无法明确告知同事或未来的自己,为了生成或修改这些数据具体采取了哪些步骤。
- 可能导致“分析瘫痪”:Excel提供了大量旨在简化工作的函数和选项,但几乎不可能掌握所有内容。这可能导致所谓的“分析瘫痪”,即因为对某个特定函数不熟悉而花费过多时间和精力去研究,而使用其他方法或手动操作可能更快找到解决方案。
- 复杂公式的稳定性问题:当使用复杂的公式(如
VLOOKUP、IF语句)时,它们有时会停止工作,迫使你不得不重新构建,这影响了工作的可靠性。 - 处理大规模数据的能力有限:当数据行数超过10,000到20,000行时,操作会变得棘手,电子表格可能会崩溃。对于极大型的数据集,电子表格处理起来非常困难。
- 复杂分析与呈现灵活性不足:对于非常复杂的分析和高级数据呈现需求,电子表格的灵活性相对较低。
总结
本节课中,我们一起学习了数据专业人士对使用电子表格进行数据分析的观点。我们了解到,电子表格在数据呈现清晰度、功能集成度以及处理中小型数据集方面具有显著优势,是入门和快速分析的利器。然而,它在操作可复现性、处理大规模数据的能力以及进行复杂分析方面存在局限性。因此,在实际工作中,应根据数据规模和分析复杂度来选择合适的工具,电子表格更适用于相对简单和中小规模的数据分析任务。
032:查看、输入与编辑数据
在本节课中,我们将学习如何在Excel中查看、输入和编辑数据。首先,我们会了解一些实用的视图功能,然后实际操作输入数据,最后学习如何修改已输入的数据。
🔍 查看数据

上一节我们介绍了Excel的基本术语和导航方法。本节中,我们来看看如何调整视图以便更好地查看数据。

当工作表中有大量数据时,放大查看特定区域会很有帮助。工作表右下角的缩放滑块可以实现这个功能。

你可以点击加号或减号按钮,也可以拖动滑块来选择你想要的缩放比例。

在功能区的“视图”选项卡中,也有一些缩放控制选项。“缩放”功能允许你选择预设的缩放级别或自定义级别。“100%”按钮可以将工作表缩放回原始大小。“缩放到选定区域”功能则允许你先选择一个数据区域,然后仅放大该特定区域。
如果你想在放大的同时查看数据的多个区域,可以使用“拆分”按钮。这会将屏幕分割成多个部分,每个部分可以单独滚动。如果只需要两个部分,可以通过双击水平或垂直分割线来移除其中一个。
如果你的列有标题行,并且希望向下滚动工作表时标题行始终可见,那么你需要使用“冻结窗格”功能。你可以选择只冻结首行。如果这不符合你的需求,例如在本例中,你可以选择要冻结行下方的行(或该行中的一个单元格),然后选择“冻结窗格”。如果你想冻结列,也可以进行类似的操作。你甚至可以同时冻结行和列。这里的技巧是,首先选择一个单元格,这个单元格要位于你想冻结行的下一行,并且位于你想冻结列的右侧一列。在本例中,这个单元格是 C4。现在,我们既可以向下滚动工作表,也可以横向滚动工作表,同时仍然能看到标题行以及“制造商”和“型号”列。
现在,如果你打开了多个工作簿(注意,我说的是工作簿,而不是工作表),你可以通过“视图”->“切换窗口”在它们之间切换。更快的方法是使用 Ctrl + F6 快捷键。
✍️ 输入数据
了解了视图功能后,接下来我们开始向空白工作表中输入数据。
在Excel中打开新工作表最简单的方法是点击快速访问工具栏中的“新建”按钮,或者如果你更喜欢键盘快捷键,可以使用 Ctrl + N。
现在,让我们在工作表顶部输入一些标题,这通常被称为标题行。
请注意,在单元格中输入数据后按 Enter 键,下一个活动单元格是正下方的单元格,但这不是我们当前想要的效果。如果在单元格中输入数据后按 Tab 键,则会选择同一行中右侧的单元格作为活动单元格。
接下来,我们将输入一些标题,并在每个条目后按 Tab 键。
注意,有些单元格中的文本稍长,它要么被下一个单元格部分遮挡,要么覆盖了下一个单元格。如果你想手动调整列宽,可以点击并按住两列之间的分隔线,然后左右拖动。如果你想自动调整,可以双击两列之间的分隔线。由于这些将是我们的列标题,让我们将它们加粗。
现在,让我们在“零件”和“配件”列之间添加一个新列。只需选中这两列中右侧的那一列,然后右键单击并选择“插入”,即可在选定列的左侧插入一个新列。我们将其命名为“维修销售”。
为了同时整理所有列宽,我们选中从A到E的所有列,然后双击任意列之间的分隔线。这会自动减小或增大每列的宽度,以适应该列中的数据。
📝 编辑数据
现在我们已经有了标题,让我们在A列输入一些月份数据。如果我们在单元格 A2 中输入“Jan”并按 Enter,它会将我们带到下方的单元格,这正是我们当前想要的。然后我们可以在单元格 A3 中输入“Feb”,依此类推,直到在 A13 中输入“December”。
现在,假设你需要更改几个标题。编辑单元格中现有数据有几种方法:
- 你可以选中单元格,然后直接重新开始输入。
- 你可以选中单元格,然后按键盘上的
F2键,将光标置于单元格末尾并进行修改。 - 你可以直接双击单元格的某个位置,将光标置于该位置并进行修改。
- 你甚至可以选中单元格,然后在编辑栏中点击以编辑单元格数据。
现在,让我们对“零件”和“配件”列标题进行同样的编辑操作。

📚 总结

本节课中,我们一起学习了Excel中的一些视图选项,以及如何在单元格中输入和编辑数据。在下一视频中,我们将学习如何复制和填充数据,以及如何设置工作表中单元格和数据的格式。




033:单元格与数据的复制、填充与格式化

在本节课中,我们将学习如何在Excel中移动、复制和填充数据,以及如何格式化单元格和数据以满足我们的需求。掌握这些基础操作是高效使用Excel进行数据分析的重要前提。
🚀 移动与复制数据
上一节我们介绍了Excel的视图功能以及数据的输入与编辑。本节中,我们来看看如何移动和复制数据。

首先,要移动数据,你可以选中一个单元格区域(例如标题行A1:E1),然后将鼠标悬停在选中区域的边缘,直到出现移动指针,接着将其拖动到工作表中的新位置。
如果你想复制数据,操作类似,但在拖动时需要同时按住 Ctrl 键,此时会出现复制指针。

如果你不习惯拖动操作,也可以使用菜单命令或键盘快捷键进行复制和粘贴。
以下是具体操作步骤:
- 选中A列的部分数据,将其复制到剪贴板。
- 选择新的目标位置,粘贴已复制的数据。
你还可以在不同工作表之间移动或复制数据。例如,创建一个新工作表,从“Sheet1”中选择一些数据,使用 Ctrl + C 快捷键复制,切换到另一个工作表,再使用 Ctrl + V 快捷键粘贴。


但请注意,默认粘贴时,目标位置的列宽设置可能与源数据不同。你可以撤销操作,尝试另一种粘贴选项。在“粘贴”命令下选择“保留源列宽”,即可保持源数据的列宽。
🔄 使用自动填充功能
除了手动输入,Excel的“自动填充”功能可以根据序列或模式自动填充单元格数据,这在需要输入大量重复或规律数据(如日期)时尤其有用。
例如,在一个单元格中输入月份名称(即使是缩写),然后使用填充柄向下拖动,自动填充功能会根据所选数据推断出序列。
让我们用星期几再试一次。在单元格中输入“Monday”,然后拖动填充柄,Excel会判断你想要按顺序输入星期几。
然而,如果你在下一个单元格中输入“Wednesday”,然后同时选中这两个单元格(A16和A17),再拖动填充柄,自动填充功能会判断序列模式已变为每隔一天,并据此为你填充数据。
在使用自动填充时,务必选中所有能确定模式的单元格,这样Excel才能准确推断出规律。

对于数字模式也是如此。如果在一个单元格中输入“5”,然后使用填充柄向下填充,由于数据不是日期或月份名称,自动填充无法判断模式,因此只会将数值“5”复制到每个选中的单元格。
但是,如果你在B3单元格输入“10”,然后使用填充柄向下填充,自动填充会判断出每次递增5的模式,并为你填充剩余的数据。

🎨 格式化单元格与数据

现在,我们来看看如何格式化数据。这主要分为两个部分:一是格式化单元格本身(如填充颜色、边框、加粗文本),二是格式化单元格中的数据(如文本格式、数字格式、特定货币或会计格式)。
让我们打开之前使用过的汽车销售工作表,然后选中标题行A3:P3。
以下是格式化单元格的步骤:
- 在“开始”选项卡中,点击“样式”下拉箭头,为选中的单元格选择一种样式颜色,然后将其加粗。
- 选中“制造商”列的数据,在“样式”下拉箭头中选择另一种样式颜色,同样可以加粗。
- 选中“型号”列的数据,选择另一种样式颜色,这次可以将其设为斜体,并更改字体大小和样式。
- 最后,选中数据区域的所有其他单元格,为其应用边框。
接下来是格式化单元格数据。例如,C列和D列的销售数据可以格式化为只显示一位小数,只需选中数据并点击“减少小数位数”按钮。
此外,我们还需要处理B129和B130单元格的问题。这两个单元格本应显示车型名称,但现在显示为两个日期。查看其数字格式,显示为“自定义”。这是因为车型号本应是“9.5”和“9.3”,但在从CSV文件导入时,这两个单元格被错误地识别为日期值。
你可以通过以下步骤修复:
- 将这两个单元格的格式设置为“文本”。
- 重新输入正确的值“9.5”和“9.3”。
最后,我们还需要将一些数据格式化为货币。查看F列的标题,它显示“价格(千美元)”,而F4单元格使用的是“常规”格式。
让我们将这一列的格式更改为美国货币格式:
- 选中F列。
- 从数字格式下拉列表中选择“更多数字格式”。
- 选择“货币”选项,并选择正确的货币符号和格式。
📝 课程总结

本节课中,我们一起学习了如何在Excel中移动、复制和填充数据,以及如何格式化单元格和单元格数据以满足分析需求。这些基础操作是构建整洁、易读数据表格的关键。

在下一节课中,我们将学习公式的基础知识,了解如何执行简单计算,以及如何选择区域和复制公式。
034:公式基础 📊
在本节课中,我们将要学习Excel公式的基础知识,包括公式的构成、如何进行基本计算、如何在公式中选择单元格区域以及如何复制公式。
公式的组成部分

上一节我们学习了如何移动、复制、填充数据以及如何设置单元格和数据的格式。本节中,我们来看看公式的基础。一个典型的公式由几个关键部分组成。
以下是公式的核心组件:
- 等号 (
=):以等号开始,告知Excel你正在该单元格中创建公式。 - 函数:执行计算的部分。例如,
SUM函数用于对引用的单元格或区域中的值进行求和。 - 引用:要包含在计算中的单元格或单元格区域,需要用括号括起来。
- 运算符:指定要执行的计算类型。常见的算术运算符包括:
- 加法:
+ - 减法:
- - 乘法:
* - 除法:
/
- 加法:
- 常量:可以直接输入到公式中且不会改变的数字或值。例如,整数
5、百分比10%或一个日期。
因此,一个典型的公式可能如下所示:=SUM(B5*20),该公式将取单元格B5中的值并乘以20。
执行基本计算

了解了公式的构成后,我们开始进行一些基本计算。假设你想汇总一月份和二月份的配件销售额。
以下是操作步骤:
- 输入等号
=,开始公式。 - 输入要使用的函数,例如
SUM。 - 输入左括号
(。 - 选择你的单元格区域。例如,要计算E2和E3的和,可以输入
E2,E3。 - 输入右括号
)并按回车键。
如果你想将三月份的销售额也加进去,就需要扩展单元格区域以包含E4,可以输入 E2,E3,E4。
然而,这种方式非常繁琐且不灵活。如果要累加整列数据,就需要逐个输入每个单元格引用。幸运的是,有更好的方法。
在公式中选择区域
与其逐个输入每个单元格,不如在区域的首尾值之间使用冒号。例如,E2:E4 表示从E2到E4的连续区域。如果要选择整列,可以输入 E2:E13。
还有一种更便捷的方法:使用鼠标选择区域。输入 =SUM( 后,直接用鼠标或配合Shift键和方向键选择所需区域,然后按回车键,Excel会自动为你添加右括号。
复制公式
为了计算各列的小计并加上20%的税费,你可以为每一列重复上述过程,但这非常耗时。Excel提供了便捷的技巧来完成这个任务。
以下是复制公式的方法:
- 使用填充柄:选中包含公式的单元格,拖动其右下角的填充柄(小方块)到其他单元格,即可复制公式。这称为“自动填充”。
- 注意相对引用:复制公式时,公式中的行引用会根据单元格在工作表中的位置自动调整。例如,原来的
E2:E13在复制到B列后变成了B2:B13。这被称为“相对引用”。
你可以对税费行(例如第16行)进行同样的操作。
接着,你需要一行来显示总计。计算很简单:例如,=B15+B16。同样,可以使用填充柄将公式横向复制到其他列。
使用自动求和与快速填充
如果你想按月汇总所有产品的销售额,可以添加一个列标题,然后像之前一样在单元格F2中输入公式。

不过,Excel还有一个技巧:“自动求和”功能。你可以在“开始”选项卡的“编辑”组中找到它。这是一个用于常见函数(如求和、平均值、计数、最大值、最小值)的快捷方式,其键盘快捷键是 Alt + =。

输入公式后,你可以使用填充柄向下复制到其余单元格。但如果数据列非常长,拖动填充柄可能会很麻烦。
这里有一个更高效的方法:双击填充柄。Excel会自动将公式复制到该列所有剩余的单元格中,这能节省大量时间。

格式化数值
最后,别忘了将所有计算出的数值格式化为美元货币格式,使数据更清晰易读。


本节课中,我们一起学习了Excel公式的基础知识,包括如何执行简单计算、如何在公式中选择区域以及如何高效地复制公式。在下一视频中,我们将探讨数据分析师常用的一些函数,并发现更多高级功能。
035:函数入门
在本节课中,我们将学习Excel函数的基础知识,包括常用统计函数的使用方法,并初步了解数据分析师可能用到的一些高级函数。通过本课,你将掌握如何利用函数高效处理数据。

📈 常用统计函数
上一节我们学习了公式基础、基本计算以及如何选择范围和复制公式。本节中,我们来看看如何使用Excel中的常用统计函数。
首先,我们为平均值、最小值、最大值、计数和中位数添加行标题。在单元格B20中,计算上方表格中全年汽车销售的平均值。
在“开始”选项卡的“编辑”组中,点击“自动求和”下拉列表,选择“平均值”。
由于“自动求和”默认会汇总该列上方的数值,我们需要将单元格范围修改为B2到B13。然后,我们可以使用填充柄(如前所述)将公式复制到E列。
对于B21中的最小值计算,我们从“自动求和”列表中选择“最小值”,同样需要修改单元格范围。此操作计算选定范围内的最低值,并填充到E列。
对于最大值计算,我们从列表中选择“最大值”,然后修改范围,并再次复制公式。此操作计算选定范围内的最高值。
在B23中,我们将计算“计数”,这基本上意味着选定范围内存在的数值个数。我们从列表中选择“计数”,然后修改范围。
对于中位数计算,我们可以从“自动求和”列表中选择“其他函数”,然后选择“统计”类别,向下滚动找到“中位数”函数。
中位数返回选定值范围的正中间值。请注意,如果选择奇数个数值,它将返回中间值;如果选择偶数个数值,它将返回两个中间值之间的平均值。同样,我们需要将单元格范围更改为B2到B13,然后将此公式复制到E列。
🔍 探索更多函数
你已经了解了“自动求和”和一些Excel中的常用统计函数,但Excel还提供了400多个其他函数。现在,让我们探索其中的一些。
在“公式”选项卡的“函数库”组中,有几个函数类别的下拉列表。
以下是各类别函数的简要介绍:
- 最近使用的函数:列表会根据你的使用情况自动更新。
- 财务函数:与财务计算相关的函数。将鼠标悬停在函数名称上,可以看到简短描述。例如,这里有“应计利息”函数和“利率”函数。
- 逻辑函数:包含布尔运算符函数,如
AND、IF和OR。 - 文本函数:包含多个与文本相关的函数,例如
CONCAT(这是旧函数CONCATENATE的更新版本,为向后兼容仍受支持)、FIND和SEARCH。 - 日期与时间函数:包含多个相关函数,如
NETWORKDAYS、WEEKDAY和WEEKNUM。 - 查找与引用函数:包含诸如
AREAS、HLOOKUP、SORTBY和VLOOKUP等函数。 - 数学与三角函数:包含许多有用的数学函数,如
POWER、SUMIF和SUMPRODUCT,以及许多三角函数,如COS、SIN和TAN。 - 其他函数:提供更多函数类别,如“统计”、“工程”和“信息”。在“统计”列表中,你可以找到诸如
AVERAGE、COUNT、MAX、MEDIAN和MIN等函数,我们在本视频前面已经看到过其中一些的使用。
🔎 如何查找函数
如果你在这些列表中难以找到所需的函数,也可以搜索函数。
只需点击“公式”选项卡上的“插入函数”按钮,然后可以浏览可用的类别列表,或选择“全部”并按字母顺序查找所需函数。
或者,键入你想要查找的函数名称并点击“转到”进行搜索,然后从返回的搜索结果中选择你需要的函数。
📝 课程总结

本节课中,我们一起学习了函数的基础知识,包括如何使用数据分析师可能用到的一些常见函数,并浏览了Excel中可用的一些更高级的函数。

在下一个视频中,我们将学习公式中的数据引用,特别是相对引用与绝对引用的区别,以及公式中的错误处理。
036:公式中的数据引用
在本节课中,我们将学习Excel公式中三种不同的单元格引用方式:相对引用、绝对引用和混合引用。我们还将了解如何识别和处理常见的公式错误。



🔗 理解相对引用、绝对引用和混合引用
上一节我们介绍了Excel函数,本节中我们来看看公式中引用单元格的不同方式。理解这些引用类型的区别对于创建准确且可复用的公式至关重要。
默认情况下,Excel中的单元格引用是相对引用。这意味着当你引用一个单元格时,实际上是在引用该单元格相对于公式所在单元格的位置。因此,当你复制公式时,引用的单元格地址会根据新位置自动调整。
有时,你希望公式中的单元格地址在复制时保持不变,这时就需要使用绝对引用。绝对引用在列标和行号前添加美元符号($)来锁定。
此外,还存在混合引用的情况,即只锁定行或只锁定列。例如,$A1(绝对列,相对行)或A$1(相对列,绝对行)。复制包含混合引用的公式时,相对部分会改变,而绝对部分保持不变。
以下是三种引用类型的核心表示:
- 相对引用:
A1 - 绝对引用:
$A$1 - 混合引用:
$A1或A$1


📝 引用类型使用示例
现在,我们通过具体例子来看看如何使用这三种引用。
相对引用示例
首先,让我们看一个在公式中使用相对引用的例子。
在单元格E4中输入公式 =A1+A3。注意,A1和A3单元格被高亮显示,表示它们被公式相对引用。
- 使用填充柄将公式向下复制到E5单元格,结果会发生变化。
- 查看E5中的公式,你会发现它变成了
=A2+A4。每个单元格引用都相对于新位置向下移动了一行。 - 如果将公式复制粘贴到C7单元格,结果同样会变,公式会变为
=C4+C6。
绝对引用示例
接下来,我们看看如何在公式中使用绝对引用。
要使单元格引用变为绝对引用,需要在列标和行号前添加美元符号($)。
在单元格E4中输入公式 =$A$1+$A$3。此时,A1和A3单元格被绝对引用。
- 使用填充柄将公式向下复制到E5单元格,结果保持不变。
- 查看E5中的公式,它仍然是
=$A$1+$A$3。单元格引用没有改变。 - 将公式复制粘贴到E7单元格,结果和公式依然保持不变。
混合引用示例

最后,我们学习混合引用的用法。
在单元格G4中输入公式 =A$1+$A3。这里,A$1是列相对、行绝对,$A3是列绝对、行相对。
- 使用填充柄将公式向下复制到G5单元格,结果会变化,但与纯相对引用的变化不同。
- 查看G5中的公式,第一个引用
A$1保持不变(行被锁定),第二个引用$A3变成了$A4(行相对变化)。 - 将公式复制粘贴到G7单元格,同样,只有相对部分(行号)发生了改变。

⚠️ 处理Excel公式错误
由于编写公式,尤其是复杂公式时容易出错,因此了解如何处理公式错误非常重要。公式错误通常会在结果单元格中显示特定的错误代码。
当单元格中显示一连串的井号(#####)时,这通常不是真正的公式错误,而是表示列宽不足以显示全部内容,或者包含了负的日期或时间值。调整列宽即可解决。
然而,如果输入了错误的公式,例如在I7单元格中输入 =5X5 并按下回车,你会看到 #NAME? 错误。这是因为Excel无法识别“X”作为乘号(正确的应为星号 *)。
请注意单元格左上角出现的绿色小三角,以及选中单元格时旁边出现的感叹号。点击感叹号下拉菜单,可以看到错误提示和多个选项:
- 错误信息:提供错误原因线索(如“无效名称错误”)。
- 关于此错误的帮助:打开帮助窗格,提供详细信息。
- 显示计算步骤:打开对话框,逐步评估公式,定位错误点。
- 忽略错误:如果你确认错误可以忽略。
- 在编辑栏中编辑:将光标定位到公式栏,方便你修改公式。
- 错误检查选项:打开Excel选项对话框,设置错误检查规则。
不同的错误代码(如#DIV/0!、#N/A、#REF!等)对应不同的原因和解决方法。如需了解更多错误代码的典型解决方案,可以参考课程提供的链接。


📚 课程总结

本节课中,我们一起学习了Excel公式中的数据引用。我们重点区分了相对引用、绝对引用和混合引用,并通过实例掌握了它们的使用方法。此外,我们还介绍了如何识别和处理常见的Excel公式错误,这将帮助你在数据分析工作中构建更健壮、准确的电子表格。
037:数据质量简介
在本节课中,我们将学习数据质量在数据分析中的核心作用,并了解评估数据质量的五个关键特征。确保数据准确、可靠是做出有效业务决策的基础。

数据分析在业务决策和流程中扮演着关键角色。为了利用数据做出正确的决策,我们必须为项目获取正确的信息,并且数据必须没有错误。
在本视频中,我们将学习如何通过数据剖析来发现不一致之处。无论我们处理的是小数据集,还是分析包含数千行的电子表格,数据分析中最困难的部分之一就是找到并保持数据的清洁。为了帮助这一过程并评估数据质量,我们需要关注以下五个特征。
以下是评估数据质量的五个核心特征:
- 准确性:这是数据质量首要且最重要的方面。数据分析师必须通过删除重复项、纠正格式错误以及移除空行来清理数据集。
- 完整性:另一个重要方面是判断完成数据集所需的信息是否易于获取。为什么这很重要?假设我们的任务是计算每个区域的销售总收入,但在收集数据后发现没有指定区域信息。那么这些数据就被视为不完整,必须考虑其他来源来获取所需数据。
- 可靠性:这是决定数据质量的另一个关键因素。例如,假设我们的任务是按客户确定代理收入。在收集数据时,我们发现代理们各自保存记录,并不总是将信息更新到共享的公司数据库中。考虑到这些因素,我们会判定共享公司数据库中的数据不可靠,需要建立新的流程来确保数据的可靠性。
- 相关性:这是优质数据的另一个特征。在收集信息时,数据分析师必须考虑所汇集的数据是否真的为项目所必需。例如,在审查每位客户的销售收入相关数据时,如果其中包含了客户生日等个人信息,早期就决定将这些个人信息排除在数据集之外,可以避免分析师审查不必要的信息。
- 及时性:决定数据质量的最后一个因素是及时性。这个特征指的是所选数据的可用性和可访问性。假设我们的销售报告将用于每周的员工评估,但报告每月才更新一次。这种数据刷新错误会导致报告过时,并对员工评估产生严重后果。
上一节我们介绍了评估数据质量的五个特征,本节我们来总结一下它们的重要性。

在本视频中,我们学习了数据分析师在通过考虑优质数据的五个特征来评估数据质量方面所扮演的重要角色。通过关注这些特征,分析师可以节省时间、避免严重问题,并获得没有错误的数据。

在下一个视频中,我们将获取收集到的数据,并学习如何将其导入到我们的电子表格中。
038:导入文本文件数据
在本节课中,我们将学习如何将文本文件中的数据导入到Excel中。你将掌握使用文本导入向导、调整列宽以及添加和删除行列的方法。这些技能对于处理来自不同来源的数据至关重要。

文本文件与Excel
默认情况下,Excel处理的是 .xlsx 或 .xls 格式的工作簿文件。然而,Excel也能导入其他格式的数据,例如纯文本文件,或使用逗号、制表符分隔的数据文件。这类文件通常以 .txt 扩展名保存,被称为文本文件;或以 .csv 扩展名保存,被称为CSV文件。
在记事本中打开一个关于汽车销售数据的文本文件,可以看到它使用了逗号分隔值(CSV)来分隔每条记录中的每个数据片段。文件的第一行包含标题,如制造商、型号、发动机排量等,每个标题之间用逗号分隔。我们希望这些标题在导入Excel后成为列标题。
标题行下方是第一行实际数据。同样,每个数据片段也用逗号分隔。总共有16个标题,标题下方的每一行数据也包含16个数据片段。滚动到文件底部,可以看到最后一条数据记录是关于沃尔沃S80的。

使用文本导入向导
要将文件在Excel中打开,请选择 文件 > 打开,然后从最近使用的列表中选择文件,或点击“浏览”找到要导入的文件。
打开文件时,文本导入向导会自动启动,并开始尝试判断你的文件类型。向导检测到这是一个分隔文件,即数据字段由逗号或制表符等字符分隔的文件。
由于我们希望标题行成为Excel中的列标题,需要确保勾选 “我的数据包含标题” 选项。可以在下方的预览框中看到数据的迷你预览。

然后,点击 “下一步” 继续。
在向导的第二步,需要选择分隔符,即分隔数据片段的字符。因此,我们选择 “逗号” 并取消选择其他选项。注意,数据预览现在开始显示导入后的数据样式。你可以滚动预览窗口,确保数据呈现的样式符合预期。
一切看起来都没问题,我们继续向导的第三步。
在第三步中,可以为每一列设置数据格式。例如,你可能希望将某列改为文本或日期格式。在本例中,我们可以直接接受默认的 “常规” 格式,然后完成导入向导。
调整列宽与行列操作

在Excel中,可以看到文本文件中的标题已作为标题行导入。但同时也注意到,有些列没有显示全部数据:部分标题未完全显示,一些数据也未显示,单元格中只看到一串井号(####)。这是因为某些列的宽度太窄。
如果你还记得,可以通过拖动列之间的分隔线来手动调整列宽。但要一次性调整所有列,可以先选中所有列,然后双击任意一个被选中的列分隔线。
对行也可以进行类似操作:拖动行分隔线来调整行高,或双击行分隔线以自动调整行高。
我们决定删除一些不需要的列,即“车辆类型”和“最新上市”。删除操作可以通过两种方式完成:
- 在 “开始” 选项卡的 “单元格” 组中,使用 “删除” 下拉菜单,选择 “删除工作表列”。
- 选中列后右键点击,选择 “删除”。
要添加一个新列,只需选中你希望新列出现位置右侧的那一列,然后右键点击并选择 “插入”。让我们给这个新列标题命名为“年份”。
要删除不需要的行,选中该行,右键点击并选择 “删除”。
要添加新行,选中你希望新行出现位置下方的那一行,右键点击并选择 “插入”。
保存为Excel文件
如果你想将文件保存为Excel文件,有两种方法:
- 选择 文件 > 另存为。
- 点击导入文件时出现在工作表顶部的黄色工具提示中的 “另存为”。
然后,在 “保存类型” 框中选择 “Excel工作簿” 或 .xlsx 格式。


本节总结
在本节课中,我们一起学习了如何使用文本导入向导导入数据、如何调整列宽,以及如何在行和列中添加和删除数据。这些是处理外部数据源的基础操作。


在下一个视频中,我们将讨论数据隐私的重要性,包括敏感信息和个人可识别数据。
039:数据隐私基础

在本节课中,我们将学习数据隐私以及管理所收集数据的相关法规。
🛡️ 数据隐私的重要性与法规
当收集客户数据时,具体法规规定了这些数据的使用方式。理解数据隐私法规并熟悉以下三个基本原则,可以消除财务处罚的风险并保持客户的信任。
以下是三个核心原则:
- 保密性:这是数据隐私的重要元素,它承认客户的个人信息属于客户本人。
- 收集与使用:对数据如何被收集和使用的规范。
- 合规性:确保所有操作符合相关法律法规。
🔍 个人数据的类型
上一节我们介绍了数据隐私的基本原则,本节中我们来看看数据分析师需要识别的不同个人数据类型。
数据分析师可能接触的信息范围很广,从销售预测到员工信息,甚至患者记录。在处理这些记录时,分析师必须能够识别不同类型的个人数据。
以下是主要的个人数据类型:
- 个人信息:任何可以追溯到特定个人的信息,例如电子邮件或图像。
- 个人可识别信息:可用于识别个人的特定信息,例如社会安全号码或驾驶执照号码。
- 敏感个人信息:这类信息不一定能识别特定个人,但包含需要保护的私人信息,因为如果公开,可能会对个人造成伤害。例如种族、性取向、生物识别或遗传信息数据。
通过理解个人数据及相关法规,我们可以通过移除不必要的信息来有效地匿名化数据。这种做法有助于建立客户信心,并促进信息的自由流动。
🌍 地域与行业特定法规
理解了个人数据的分类后,我们来看看管理这些数据的具体法规。这些法规通常与数据收集的地理位置和行业密切相关。
在搜索数据时,分析师必须了解收集数据的公司所在地以及受访者所在地。了解数据收集地是数据隐私的关键要素,决定了必须适用哪些法规。
以下是主要的地域性法规:
- 《通用数据保护条例》:这是欧盟特有的法规,仅适用于欧盟境内的个人管辖范围。
- 巴西《通用数据保护法》:这项于2020年8月生效的新法律适用于巴西境内的个人,而不考虑数据处理者的位置。
- 美国各州法规:美国没有全国统一的数据隐私法,因此各州开始制定自己的法规。例如,加利福尼亚州制定了《加州消费者隐私法案》以更好地保护客户数据。
此外,还有行业特定的法规来管理敏感和个人数据的收集与使用:
- 医疗保健行业:HIPAA隐私规则管理受保护健康信息的收集和披露。
- 零售行业:PCI标准管理信用卡数据,未能保护持卡人信息可能导致巨额罚款。
对这些政策有基本了解后,我们就能在处理任何敏感信息时保持合规。不幸的是,客户数据泄露事件屡见不鲜,因此理解如何保持合规至关重要。
⚠️ 合规案例与数据匿名化
了解了主要法规后,我们通过一个案例来看看不合规的后果,并探讨如何通过匿名化避免隐私问题。
理解欧盟、美国及其他国家和行业的数据隐私法规是保护数据安全的关键。公司必须始终遵守这些隐私法规,并确保员工能够方便地获取相关政策。
例如,假设一名数据分析师下载了一份包含敏感信息的电子表格。为了在周一早上完成报告,该分析师决定周末将工作笔记本电脑带回家。开车回家后,分析师不小心将笔记本电脑留在了车里。第二天早上,他们发现汽车连同笔记本电脑一起被盗。由于公司有责任保护客户数据安全,当数据离开公司财产时,就构成了隐私泄露。这种行为不仅可能使公司面临巨额罚款,还可能降低客户信心,对收入造成重大影响。
虽然数据隐私适用于大多数收集的数据,但在某些情况下这些法规并不适用。为了使这些法律和法规不适用,特定的数据收集必须是完全匿名的。
使数据匿名化意味着排除所有能将其与特定个人关联起来的数据。 虽然这种方法在所有情况下可能都不切实际,但在收集数据时考虑到隐私可以消除隐私限制,使数据收集更容易进行。

📝 课程总结
本节课中,我们一起学习了数据隐私的重要性,以及数据分析师在收集和整理数据时可能面临的挑战。我们探讨了个人数据的类型、关键的地域与行业法规,并通过案例理解了合规的必要性和数据匿名化的方法。

在下一课的系列视频中,我们将学习在电子表格中清洗数据的不同方法。
040:数据质量与隐私的重要性 👁️🗨️


在本节课中,我们将聆听几位数据专业人士的见解,探讨数据质量和数据隐私在数据分析中的重要性。


数据质量的重要性
上一节我们介绍了本课的主题,本节中我们来看看数据质量为何如此关键。多位专家强调了高质量数据是任何分析项目的基石。
以下是数据专业人士阐述数据质量重要性的几个核心观点:
- 信任与可信度:数据质量至关重要。当你的分析结果与他人的预期不符时,他们首先会质疑数据的来源、处理过程及转换方式。人们通常认为自己了解业务,如果你的数据质量不高、不干净或来源不可信,你将陷入无休止的争论,最终导致分析结论失去说服力。
- 垃圾进,垃圾出:任何成功数据分析项目的支柱都是高质量数据。计算机科学中有一个常见术语:
垃圾输入,垃圾输出(Garbage In, Garbage Out)。其本质是,如果输入低质量数据,你只能得到低质量的结果。因此,数据分析中最重要的事莫过于确保你使用的是高质量数据。亲自检查数据并确信其质量极高,这一点非常重要。 - 准确性至上:数据准确性高于一切。分析低质量数据是浪费时间,并可能误导业务方向。你所使用或提供给他人使用的数据完整性至关重要。数据被用来决定产品发布的时间或地点,判断部门是否盈利。如果不关注细节,很容易混淆。以库存为例,如果你在SKU层面分析库存,却不小心选错了SKU进行分析,进而得出某个产品不盈利的结论,而事实却相反。这对公司来说显然是一个重大决策。因此,期望在分析初期就进行大量尽职调查。如果你从有问题的数据开始构建分析,之后才发现问题,你将损失时间、精力、努力,有时甚至是他人的信任。
数据隐私的重要性

了解了数据质量的基础作用后,我们接下来探讨另一个关键维度:数据隐私。在处理敏感信息时,保护数据隐私是重中之重。
以下是关于数据隐私重要性的主要观点:
- 行业普遍要求:数据隐私极其重要,尤其是在制药或医疗保健等行业,但这并非全部。我们必须有能力确保用户根据其角色和权限获得相应级别的数据。我们可以通过多种方式实现,例如为每个地区或职能提供特定的数据切片。在某些工具(如认知分析)中,我们可以在模型内部构建权限,指定谁可以访问什么,无论是细粒度地控制某人只能查看加拿大或美国的数据,还是简单地控制某人能否查看完整报告。处理方式多种多样,但数据隐私在所有行业都至关重要。
- 保护个人信息:在当今世界,数据隐私是一个重大问题。特别是在我们的税务业务中,我们拥有所谓的
PII(个人可识别信息),我们必须保护它。因此,我们不能仅仅通过电子邮件发送资料。我们不会通过电子邮件发送报税表,实际上,在我们的业务中,任何包含敏感PII数据的文件都不会通过普通邮件发送。我们会加密邮件,确保邮件被加密,或者使用特定软件来隐藏社会安全号码、姓名或出生日期等信息。这些信息会以特定序列呈现,我们通过电话与客户分享该序列,绝不会将其与加密信息放在同一封邮件中,以确保始终安全。我们必须不惜一切代价确保数据受到保护。
课程总结
本节课中,我们一起学习了数据质量和数据隐私在数据分析中的核心重要性。我们了解到,高质量的数据是产出可靠分析结果的先决条件,而保护数据隐私,尤其是在处理敏感个人信息时,是所有数据分析师必须遵守的伦理和法律准则。确保数据的准确性、完整性和安全性,是进行有效、负责任的数据分析的基础。
041:处理重复、不准确数据与空行 🧹
在本节课中,我们将学习如何处理数据中的不准确信息、删除空行以及移除重复数据。这些操作是数据清洗的基础步骤,能显著提升数据集的质量和可用性。
我们已经了解了数据质量和数据隐私的重要性。本节中,我们来看看如何具体处理数据中的常见问题。
在收集或导入数据时,无论是通过手动还是自动流程,数据中出现错误和不一致的情况都非常普遍。这些错误可能很简单,比如拼写错误、多余的空格、文本大小写错误,也可能是空行、缺失值、不准确或重复的数据。数据中的这些错误和不一致会导致公式无法正常工作、排序和筛选操作失败,进而影响数据可视化和分析结果的呈现。因此,我们需要执行数据清洗流程来改善数据的质量和可用性。

1. 拼写检查 ✏️
让我们从一项相对简单的任务开始:在Excel中进行拼写检查。其工作原理与你在Microsoft Word等文字处理软件中遇到的基本相同。
以下是操作步骤:
- 首先,选择需要检查拼写的数据区域。例如,我们选择包含产品线数据的K列。
- 然后,点击“审阅”选项卡下的“拼写检查”按钮。
- 检查完成后,我们可以尝试检查包含国家信息的T列。这里发现了一个国家名称的拼写(或更可能是打字)错误。
- 如果对拼写建议满意,点击“更改”。也可以从列表中选择其他建议,或者如果确认数据正确,可以选择“忽略”。在本例中,我们选择“更改”。
- 继续处理该列中的其他拼写错误。
- 最后,检查包含交易规模数据的X列。这里发现了“small”和“medium”的拼写错误,并进行更正。
2. 删除空行 🗑️
数据中的空行会导致许多问题,例如在数据间移动、使用公式以及排序和筛选时出现错误。因此,删除空行非常重要。
如果你还记得之前的课程,按 Ctrl + ↓ 应该能跳转到该列数据的末尾。但在当前数据集中,光标遇到空行就会停止,这意味着数据集被这些空行分割成了多个部分。这很不理想,让我们来解决它。
我们有几个选择。一种方法是手动滚动工作表,寻找并逐个删除空行。这对于数据量小的情况是可行的。但如果你要处理成百上千甚至上万行数据,这将是一个非常耗时费力的过程。有一个更好的方法。
以下是使用筛选功能批量删除空行的步骤:
- 首先,选中所有数据。可以使用鼠标,或按
Ctrl + Shift + End快捷键。 - 然后,在“数据”选项卡下点击“筛选”图标。现在,每个列标题旁边都会出现一个筛选图标。
- 点击“客户名称”列(M列)的筛选图标。
- 取消勾选“全选”。
- 滚动到列表底部,勾选名为“空白”的项,然后点击“确定”。
- 现在,工作表顶部将只显示空行。查看行号,可以看到第28、29、65、73、74、75和117行被列出并以蓝色高亮显示。
- 选中这些行(可以使用鼠标,或先定位到第一个数据行A28,然后按
Ctrl + Shift + End)。 - 删除这些空行。
- 最后,清除筛选并关闭它,以重新查看完整数据。
现在,回到数据表顶部,再次尝试按 Ctrl + ↓ 跳转到数据列末尾,操作将正常进行。
3. 删除重复数据行 🔍
导入的数据中常常存在重复的数据行,这可能是由人工输入错误或导入过程错误引起的。在Excel中有两种方法可以处理。
第一种方法允许你在删除前先预览计划删除的数据,以确保删除正确。这是我们推荐的方法,因为它提供了额外的数据安全保障。第二种方法更简单,但缺乏第一种方法的安全性,因为它不预先审查要删除的数据。

重要提示:需要选择一个你预期不会有重复值的列。例如,“单价”列很可能有很多重复值,因为某些产品的单价相同,因此不适合用来查找重复项。相反,我们可以使用“销售额”列,因为在正常流程中,每个订单的总销售额值重复的可能性要小得多。
方法一:使用条件格式标记并手动审查
以下是使用条件格式查找并手动删除重复项的步骤:
- 选中“销售额”列(E列)。
- 选择“开始”选项卡下的“条件格式”。
- 选择“突出显示单元格规则”,然后选择“重复值”。
- 点击“确定”后,滚动工作表,可以看到只有少数值被标记为重复。例如,第36至40行和第74至78行。
- 经审查,这些确实是完全相同的重复条目,很可能是输入错误。
- 例如,我们可以删除第二个重复部分(第74至78行),因为它们与摩托车销售相关,却错误地出现在船舶销售部分。
方法二:使用“删除重复项”功能直接删除
以下是使用内置功能直接删除重复项的步骤:
- 回到工作表顶部,选中整个数据区域。
- 在“数据”选项卡下,点击“删除重复项”按钮。
- 在弹出的对话框中,先取消勾选所有列。
- 然后,仅勾选“销售额”列。
- 点击“确定”,重复的行将被直接删除。
4. 使用查找与替换功能修复数据 🔄
本视频中我们要看的最后一个清洗过程是使用“查找和替换”功能来修复“客户联系人”列中一些拼写错误的姓氏。
Excel中的查找和替换工具位于“开始”选项卡的“查找和选择”下拉菜单中。如果你使用过Word等其他Office产品,应该对此很熟悉。
假设我们收到一封瑞典客户的电子邮件,通知我们她的姓氏在订单中被拼错了。
以下是操作步骤:
- 将拼错的姓氏输入“查找内容”框,点击“查找下一个”。
- 再次点击以查看是否有多个错误条目。
- 点击“查找全部”,所有实例都会被列出。
- 切换到“替换”选项卡,在“替换为”框中输入正确的姓氏(例如,
Larsson)。 - 点击“全部替换”,所有错误拼写将被更正。
总结 📝
本节课中,我们一起学习了如何处理不准确数据、删除空行以及移除重复数据。我们掌握了拼写检查、利用筛选删除空行、通过条件格式或“删除重复项”功能处理重复数据,以及使用查找与替换修复特定错误。


在下一个视频中,我们将学习如何更改文本大小写、修复日期格式错误以及修剪数据中的多余空格。
042:处理数据不一致性
在本节课中,我们将学习如何处理数据中的不一致性问题,包括文本大小写转换、日期格式修正以及清除多余空格。这些技能对于确保数据质量至关重要。

上一节我们介绍了如何处理不准确数据、删除空行和重复行。本节中,我们来看看如何通过改变文本大小写、修正日期格式和修剪空格来进一步清理数据。
从不同来源收集或接收数据时,数据中的文本大小写常常不一致。有些是大写,有些是小写,有些是首字母大写(也称为句首大写)。部分情况可能是故意的,但通常并非如此。Excel没有像Microsoft Word那样的“更改大小写”按钮,因此需要使用其他方法来完成此数据清理任务。
这些方法就是函数,即UPPER、LOWER和PROPER函数。你可以使用这些函数来更改数据中文本的大小写。
以下是使用这些函数的步骤:
-
使用PROPER函数将标题行转换为首字母大写
- 首先,在标题行下方插入一个辅助行。
- 在辅助行的第一个单元格(例如A2)中输入公式:
=PROPER(A1)。 - 按Enter键,A2单元格将显示A1内容的首字母大写结果。
- 要快速将公式应用到所有标题列,可以先选中A2到X2的单元格区域,然后按
F2键将光标定位到A2,最后按住Ctrl键并按Enter键。 - 复制辅助行的内容,在标题行使用“粘贴值”选项进行粘贴,然后即可删除辅助行。
-
使用UPPER函数将文本转换为大写
- 在需要更改的列右侧插入一个辅助列。
- 在辅助列的第一个数据单元格(例如新列的第一个单元格)中输入公式:
=UPPER(T2)(假设T2是原列的第一个数据单元格)。 - 按Enter键,然后双击填充柄将公式复制到该列其余部分。
- 复制辅助列的内容,在原列使用“粘贴值”选项进行粘贴,然后删除辅助列。
-
使用LOWER函数将文本转换为小写
- 在需要更改的列右侧插入一个辅助列。
- 在辅助列的第一个数据单元格中输入公式:
=LOWER(K2)(假设K2是原列的第一个数据单元格)。 - 按Enter键,然后双击填充柄将公式复制到该列其余部分。
- 复制辅助列的内容,在原列使用“粘贴值”选项进行粘贴,然后删除辅助列。
接收到的数据常常混合使用多种日期格式,或者使用了不适合你所在区域的日期格式。现在,让我们看看如何更改某些日期的格式。
如果日期当前使用的是“日-月-年”格式(例如英国格式),而你需要美国格式(月-日-年),可以按以下步骤操作:
- 选中日期单元格。
- 打开“设置单元格格式”对话框(通常在“开始”选项卡的“数字”组中)。
- 在“区域设置”中,将“英语(英国)”更改为“英语(美国)”。
- 从列表中选择一个合适的日期格式,例如使用完整月份名称的格式。
- 点击“确定”应用格式。
如果你想使用自定义日期格式:
- 在“设置单元格格式”对话框中,选择“自定义”类别。
- 在“类型”框中,选择一个现有格式作为基础进行修改。例如,你可以创建格式
dd-mmm-yyyy来显示“日-三字母月份-年”。 - 点击“确定”应用。你可以使用格式刷工具或通过“设置单元格格式”对话框将此自定义格式应用到整列。

你的数据中可能包含一些多余的空格,例如开头、结尾或单词之间的双空格。我们将首先使用Excel的“查找和替换”功能来清理这些多余空格。
以下是操作步骤:
- 选中所有数据。
- 在“开始”选项卡上,点击“查找和选择”,然后选择“替换”。
- 要删除双空格,在“查找内容”框中输入两个空格,在“替换为”框中输入一个空格。
- 点击“查找下一个”,然后对每个需要更改的项点击“替换”。如果你非常确定更改无误,可以点击“全部替换”一次性完成所有修正。对于大型数据集,这可以节省大量时间。
然而,“查找和替换”功能可能无法清除所有空格,特别是单元格开头和结尾的单个空格。你不能用它来删除所有单个空格,否则会误删单词之间的正常空格。
此时,你可以使用TRIM函数来清除这些空格:
- 在需要清理的列旁边插入一个辅助列。
- 在辅助列的第一个单元格中输入公式:
=TRIM(M2)(假设M2是原列的第一个数据单元格)。 - 按Enter键,然后双击填充柄将公式复制到该列其余部分。
- 复制辅助列的内容,在原列使用“粘贴值”选项进行粘贴。
- 删除辅助列。现在,那些多余的空格已被清除(或者说被“修剪”掉了)。
本节课中,我们一起学习了如何通过UPPER、LOWER、PROPER函数改变文本大小写,如何调整日期格式以适应不同区域或自定义需求,以及如何使用“查找和替换”功能和TRIM函数来清除数据中的多余空格。这些技巧能有效提升数据的一致性和可读性。


在下一视频中,我们将讨论如何使用Excel的“快速填充”和“分列”功能来帮助清理数据。
043:更多数据清洗功能
在本节课中,我们将学习如何使用Excel中的“快速填充”和“分列”功能来辅助清洗数据。这些工具能帮助我们高效地合并、拆分和格式化文本数据。
🧹 使用快速填充合并数据
上一节我们介绍了如何更改文本大小写、日期格式以及修剪空格。本节中,我们来看看如何使用“快速填充”功能来合并数据。

“快速填充”能识别数据模式,并自动填充数据。例如,我们可以将分开的“姓氏”和“名字”列合并为一个完整的“联系人姓名”列。
以下是具体操作步骤:
- 在数据旁插入一个辅助列,例如命名为“联系人姓名”。
- 在新列的第一行,按照你想要的格式输入第一个联系人的全名。例如,输入
名字 姓氏。 - 按下回车键,然后在第二行开始输入第二个联系人的名字。
- 此时,“快速填充”会显示剩余数据的预览。如果预览正确,直接按下回车键,Excel将自动填充整列。
即使原始列中包含复合名(如“Wing C”),此功能也能正常工作。
完成合并后,如果不再需要原始的“姓氏”和“名字”列,可以将其删除。
🔄 使用快速填充修改命名规范
在上一任务中,我们看到了如何合并两列数据。现在,让我们看看如何使用“快速填充”来修改一列数据中的命名规范。
假设我们有一列“客户联系人”数据,格式为“名字 姓氏”,我们希望将其改为“姓氏, 名字”的格式。
以下是具体操作步骤:

- 在数据旁的新列(例如B列)的第一行,输入第一个联系人姓名,使用新的命名规范,例如
姓氏, 名字。 - 按下回车键,然后在第二行开始输入第二个联系人的姓名。
- “快速填充”会检测到模式,并在你按下回车键后,自动用新格式填充B列的其余姓名。
之后,你可以复制粘贴列标题,并删除原始的A列。
✂️ 使用分列功能拆分数据

“快速填充”无法将包含两个名字的单列拆分为两列。这时,我们需要使用“分列”功能。
顾名思义,“分列”功能可以将包含多部分文本的列拆分为多个单独的列。这对于拆分姓名、地址等复合文本非常有用。
以下是使用“分列”拆分姓名的步骤:
- 在数据右侧添加两列新的列标题。
- 选中A列中需要拆分的数据(例如A2:A23)。
- 在“数据”选项卡中,点击“分列”,启动向导。
- 在向导第一步,确保选择“分隔符号”。
- 在第二步,确保只勾选“空格”作为分隔符。
- 在第三步,点击“目标区域”旁的小箭头,选择工作表上的B2单元格,然后返回向导。
- 点击“完成”。
现在,A列中的完整客户姓名已成功拆分为B列(名)和C列(姓)。如果不再需要A列,可以将其删除。
📝 使用函数实现分列
如果你使用的是Excel网页版(在线版本),它没有“分列”功能,这时可以使用函数达到相同效果。使用函数还提供了更大的灵活性,尤其适用于处理包含连字符、中间名或不同数量中间名首字母的复杂姓名。
以下是使用函数拆分姓名的步骤:
- 在数据右侧添加两列新的列标题。
- 在B2单元格输入公式提取名字部分:
=LEFT(A2, 5)
此公式从A2单元格的左侧开始提取5个字符(包括空格)。 - 在C2单元格输入公式提取姓氏部分:
=RIGHT(A2, 7)
此公式从A2单元格的右侧开始提取7个字符。 - 双击B2单元格的填充柄,使用自动填充完成整列。
- 同样,双击C2单元格的填充柄,完成该列的填充。

📚 课程总结

本节课中,我们一起学习了如何使用Excel的“快速填充”和“分列”功能来清洗数据。我们掌握了如何合并两列数据、修改一列数据的命名规范,以及如何将一列复合文本拆分为多列。我们还了解了在无法使用“分列”功能时,如何通过函数实现相同的效果。这些工具能显著提升数据整理的效率和准确性。
044:数据质量问题的观点与讨论 👩💼👨💼
在本节课中,我们将聆听几位数据专业人士围绕数据质量问题展开的讨论。我们将了解他们在工作中遇到的数据质量挑战、数据清洗的重要性,以及确保数据完整性对分析结果可靠性的关键影响。

数据质量问题的普遍性与影响
上一节我们介绍了数据分析的基本流程,本节中我们来看看数据质量这一基础却至关重要的环节。多位专业人士指出,数据质量问题是数据分析工作中的常见挑战。
一位在医疗保健领域工作的分析师提到,其大部分时间都花在了数据清洗上。由于大部分信息依赖于人工录入,而“人类无法被标准化校准”,不同的人对相似情况的描述可能存在细微差异。例如,一人可能将某物描述为“海军蓝”,另一人则描述为“深蓝色”,分析师需要将其统一整合为“蓝色”。虽然这只是一个示例,但其核心思想是:在进行分析之前,必须检查信息的完整性,以确保分析结果的准确性。
数据不完美的现实与清洗活动
认识到“没有数据是完美的”这一现实后,我们需要采取行动。数据通常为最广泛的用途而收集,因此常常会出现信息缺失或格式不符合特定分析需求的情况。
例如,日期和时间可能被记录在同一个字段中,而分析时我们可能需要将其拆分为日、月、季度等独立部分。为此,我们可以进行多种数据清洗活动。
以下是常见的数据清洗考虑事项:
- 格式标准化:如统一日期格式、文本大小写等。
- 数据拆分:将复合字段(如“日期时间”)拆分为独立字段。
- 数据合并:将相似但表述不同的值(如“海军蓝”与“深蓝色”)归类统一。
- 缺失值处理:识别并合理填充或标记缺失的数据。
这些清洗工作旨在将原始数据转化为特定、可用且符合你分析需求的形式。
财务数据分析中的质量挑战
从财务分析的角度看,数据质量问题同样突出。在审查财务报表、计算利润率与比率时,分析师必须质疑数据的正确性。
分析师需要思考以下关键问题:
- 数据在趋势上是否正确?
- 我查看的是正确的项目吗?
- 所有成本是否都与我所分析的期间相关?
- 所有数据是否都已完整捕获?例如,某个月份的收入数据是否齐全?
如果发现数据存在问题,就必须追溯数据源,仔细核对信息以验证其正确性。从会计角度看,如果数据错误或所属期间不对,就需要对存储这些数据的总分类账进行调整,以准确反映实际情况。
低质量数据的后果与应对策略
低质量的数据会引发一系列不良后果。它可能导致不必要的讨论,让你对自己的分析产生怀疑,并削弱你可靠地呈现数据和论据的能力。
面对数据质量问题,可以采取以下几种应对策略:
- 追溯源头:确保源数据被正确提取和记录。
- 明确记录:使用类似知识目录(Knowledge Catalog) 的工具,清晰、具体地记录对数据所做的所有转换或更改,并能向受众展示这一过程。
- 早期修复:在数据筛选和排序过程中一旦发现错误,应立即回溯修正。否则,本可用于其他工作的时间将被浪费。
不断重做或重复处理数据的某些部分,会让人质疑数据的完整性,并且坦率地说,如果习惯性地这样做,会令人感到沮丧。因此,关注细节,避免在后期浪费时间回溯本可以早期修复的问题,是确保数据质量良好的众多益处之一。
总结与核心要点
本节课中,我们一起学习了数据专业人士对数据质量问题的见解。核心要点包括:
- 数据清洗是数据分析的关键前置步骤,占用大量时间。
- 数据不完美是常态,清洗旨在使其变得特定、可用。
- 在财务等严谨领域,必须验证数据的完整性、相关性与准确性。
- 低质量数据会导致错误结论、时间浪费与信任丧失。
- 应对策略包括:追溯源头、明确记录转换过程、以及尽早发现并修复问题。

记住,确保良好的数据质量,是产出可靠、可信分析结果的基石。
045:使用电子表格分析数据入门
在本节课中,我们将学习如何对已收集和清洗好的数据进行分析。我们将探讨筛选、排序、执行计算以及重塑数据的重要性,以从中提取有意义的信息。

🎯 分析前的规划
在开始对数据进行任何更改或调整之前,我们需要先设想最终的分析结果。以下是在开始分析任务前需要思考的几个问题:
- 数据集有多大?
- 需要何种筛选才能找到必要的信息?
- 数据应如何排序?
- 需要进行何种类型的计算?

🔍 筛选与排序:数据整理的基础
上一节我们介绍了分析前的规划,本节中我们来看看整理数据最基础的步骤:筛选和排序。
通过排序,我们可以根据字母顺序或数值大小等条件来组织数据。
例如,如果我们想检查是否有重复的订单号,可以对数据进行排序,从而快速发现重复项。在排序并删除重复行之后,我们可能发现视图仍需进一步细化以满足需求。

此时,我们可以决定只查看11月份的数据。通过添加筛选器,我们可以选择只显示“月份ID”等于11的行。筛选数据使我们能够只看到符合筛选条件的行,从而更好地分析信息。
🧮 使用函数进行计算
熟悉所有数据分析工具可能令人望而生畏,但使用电子表格的一个关键优势是能够利用函数。
Excel中的函数按多个类别组织,包括数学、统计、逻辑、财务以及日期和时间函数。
假设我们想计算公司6月份的平均收入。我们发现有超过100个项目需要计算。在正常情况下,要计算平均值,我们必须创建一个公式来将每一行相加,然后除以总行数。这种计算不仅非常冗长,还可能导致分析师犯错。

通过使用函数,我们可以将计算简化为一步:=AVERAGE(B1:B160)。
📋 将数据转换为表格的优势
虽然直接在电子表格上排序和筛选数据本身很有用,但首先将数据转换为表格会带来更多好处。将数据转换为表格后,我们能够更高效地进行筛选和计算。
一个例子是能够轻松计算列的总和。对于“MSRP”列,我们选择“求和”,就能快速计算出该列的总和。
如果我们随后只想计算与“日本”相关的MSRP总和,可以筛选“国家”列只显示日本,那么该列将只对与日本相关的行中的值进行求和。
虽然并非所有数据都适合放入表格,但将数据格式化为表格有不少优势:自动计算、筛选时列标题不会消失、使用交替行颜色使阅读更轻松,以及在添加新行时表格会自动扩展。
📊 使用数据透视表与图表进行深入分析
有时,数据需要比基础表格格式更高级的组织方式,而创建带有图表的数据透视表可能是分析和展示所需信息的更好方法。
在Excel中,我们可以选择创建数据透视表来显示和分析数据,并可选择性地创建关联的数据透视图。
例如,假设我们想知道10月份有哪些公司订购了产品。我们可以从原始数据表创建一个数据透视表来组织和分析所需数据,并配上一个数据透视图来展示信息。
然后,通过将月份筛选器添加到新创建的数据透视表中,我们不仅可以在表格中看到10月份的结果,而且这些变化会自动更新到数据透视图中。
当需要从大型数据集中提取特定信息时,数据透视表是一种很好的方式,可以只显示所需的信息。这使我们能够快速、轻松地浏览关键信息。
数据透视图是数据透视表的有力补充,它们允许我们以视觉方式处理数据,并且在大多数情况下,能让观众更快地掌握信息。
选择使用数据透视表和图表的主要优势包括:无需使用公式即可操作数据、快速汇总大型数据集、能够展示引人入胜的图表。

📝 课程总结

本节课中,我们一起学习了筛选、排序、执行计算和重塑数据以提供有意义信息的重要性,并了解了一些开始分析数据的工具。在下一个视频中,我们将更深入地学习如何筛选和排序数据。
046:Excel中的数据筛选与排序 📊
在本节课中,我们将学习如何在Excel中使用筛选和排序功能。这些工具能帮助我们控制工作表中显示哪些数据,以及数据如何显示,从而更有效地分析和理解数据。
概述
上一节我们介绍了如何使用“快速填充”和“分列”功能来清理数据。本节中,我们来看看如何通过筛选和排序来进一步管理和组织数据。
筛选功能让你能根据特定条件,只显示符合要求的数据行。排序功能则允许你按字母、数字或日期顺序重新排列数据,使其更易于阅读和分析。

启用筛选功能
要筛选数据,首先需要开启筛选功能。操作非常简单。
- 选中你的数据区域。
- 转到 “数据” 选项卡。
- 点击 “筛选” 按钮。
操作完成后,每个列标题的右侧都会出现一个小的筛选图标。
注意:如果你只想对特定的一列或多列应用筛选,可以先选中这些列,然后再点击“筛选”按钮。
另一个注意点:如果你将数据区域格式化为表格,筛选控件会自动添加到每一列。
应用筛选
现在,每一列都可以应用筛选器。例如,在“订单日期”列,你可以按年份筛选;在“产品线”列,可以按产品类型筛选;在“客户名称”列,可以按客户名称筛选。
让我们先按年份筛选。
以下是操作步骤:
- 点击“订单日期”列的筛选图标。
- 在列表中,仅勾选“2004”年,取消勾选其他年份。
- 点击“确定”。
此时,工作表底部的状态栏会显示,当前仅显示了114条记录中的50条。
要清除一个筛选,可以点击该列的筛选图标,然后选择 “从…中清除筛选”,或者直接勾选列表中的 “全选”。
应用多个筛选
到目前为止,我们每次只应用了一个筛选。但你可以同时应用多个筛选来更精确地缩小数据范围。
例如,我们可以同时启用以下筛选:
- “订单日期”为2004年。
- “产品线”为“经典汽车”。
- “客户名称”为“Many Gifts Distributors Ltd.”。
这样,我们就只显示了2004年销售给“Many Gifts Distributors Ltd.”公司的“经典汽车”订单。
记住:如果想单独清除某一个筛选,点击该列的筛选按钮并选择“从…中清除筛选”。如果想快速清除所有筛选,可以使用 “数据” 选项卡下 “排序和筛选” 组中的 “清除” 按钮。
使用自定义筛选
除了自动筛选,你还可以使用自定义筛选来指定更复杂的条件,特别是针对文本或数字。

例如,如果你想查看销售额超过特定数值的订单,可以使用数字筛选。
以下是操作步骤:
- 点击“销售额”列的筛选图标。
- 选择 “数字筛选” > “大于”。
- 在弹出的对话框中输入
2000。 - 点击“确定”。
状态栏会显示,现在显示了114条记录中的111条。清除这个筛选,再应用一个“小于2000”的筛选,可以看到只有3条记录。
重要提示:被筛选隐藏的数据行并没有被删除,它们仍然存在于工作表中,只是暂时不可见。左侧蓝色的行号会出现跳跃(例如从69直接跳到很大的数字),这表示数据集中存在比当前显示更多的行。

对于包含文本的列,筛选菜单会变为 “文本筛选”,并提供如“开头是”、“结尾是”、“包含”等多种选项。

要完全关闭工作表的筛选功能,只需再次点击 “数据” 选项卡上的 “筛选” 按钮。
数据排序
排序是数据分析师工作中的重要部分。通过按逻辑参数(如字母、数字、日期)组织数据,可以让你以更有意义的方式理解和可视化数据。
排序数据时,首先需要选择要排序的数据范围。
以下是基本排序操作:
- 按文本排序:要按客户名称字母顺序排序,先选中“客户名称”列中的一个单元格,然后点击 “从A到Z排序” 或 “从Z到A排序”。
- 按数字排序:要按销售额数值排序,先选中“销售额”列中的一个单元格,然后点击 “从最小到最大排序” 或 “从最大到最小排序”。
- 按日期排序:要按订单日期先后排序,先选中“订单日期”列中的一个单元格,然后点击 “从最旧到最新排序” 或 “从最新到最旧排序”。
多级排序
你还可以同时按多个列进行排序,这称为多级排序。
以下是操作步骤:
- 选中数据区域内的任意单元格。
- 转到 “数据” 选项卡,点击 “排序” 按钮。
- 在弹出的“排序”对话框中:
- 在 “主要关键字” 下拉列表中选择第一排序列(例如“订单日期”),并选择排序顺序(例如“从最旧到最新”)。
- 点击 “添加条件” 按钮,添加第二个排序级别。
- 在 “次要关键字” 下拉列表中选择第二排序列(例如“销售额”),并选择排序顺序(例如“从最大到最小”)。
- 如果你的数据包含标题行(像我们这里一样),请确保勾选 “数据包含标题” 复选框。
- 点击 “确定” 进行排序。
这样,数据会首先按订单日期从早到晚排序。对于同一天内的多个订单,则会再按销售额从高到低进行排序。
总结

本节课中,我们一起学习了如何在Excel中使用筛选和排序工具。筛选功能帮助我们根据条件显示特定数据,而排序功能则让我们能够按逻辑顺序组织数据。掌握这两个功能,能让你更高效地控制工作表中信息的显示方式和内容,为后续的数据分析打下坚实基础。
047:数据筛选与排序的重要性
在本节课中,我们将学习数据筛选与排序在数据分析中的核心作用。多位数据专家将分享他们的见解,帮助我们理解为何这些基础操作是高效分析的关键。

🎯 概述:为何筛选与排序至关重要
筛选与排序是数据分析和可视化过程中极为重要的环节。它们能帮助你从单一数据视图中,为他人提供自主分析的功能。
上一节我们介绍了数据分析的基本流程,本节中我们来看看如何通过筛选与排序来聚焦数据。
🔍 理解排序:组织数据的艺术
排序通常指将数据按从高到低、字母顺序等方式进行排列。但在某些情况下,你可能需要进行自定义排序。
例如,你可以将特定产品或服务排在列表开头,其余项目跟随其后。或者,你可以将主要竞争对手的数据分组展示,以便进行对比分析。
🛠️ 筛选功能:深入数据核心
我非常喜爱 Microsoft Excel 中的筛选与排序功能。它使我能够深入数据的核心。
例如,通过筛选,我可以快速查看某个客户在特定时间段内的收入,或他们在特定时期内的盈利情况,而无需逐行浏览大量信息。
因此,筛选与排序能帮助你缩小数据范围,获取非常具体的信息,并找到你想要的答案,而不是淹没在大量不必要的数据中。
📈 筛选在可视化中的应用
当我们谈论筛选时,指的是我希望基于某个特定值来查看对应的数据。
以下是筛选在数据可视化中的一个应用示例:
假设我们有一个显示月度销售额的柱状图。如果我想查看特定地区或特定产品线的销售额,我可以应用筛选功能。

这样,我的销售额数据就会仅针对某一个地区或某一条产品线进行展示,使得分析更加聚焦和清晰。
💎 总结
本节课中,我们一起学习了数据筛选与排序在数据分析中的重要性。我们了解到,排序能帮助我们以更有意义的方式组织数据,而筛选则允许我们深入细节,快速获取特定问题的答案。掌握这些基础技能,将为你后续的数据分析工作打下坚实的基础。
048:数据分析常用函数
在本节课中,我们将学习Excel中数据分析师最常用的几个函数:IF、IFS、COUNTIF 和 SUMIF。这些函数能帮助你根据条件进行逻辑判断、计数和求和,从而更高效地处理和分析数据。
🔍 IF 函数:基础逻辑判断
上一节我们介绍了如何使用筛选和排序工具来控制数据的显示方式。本节中,我们来看看如何利用IF函数进行逻辑比较。
IF函数是Excel中最常用的逻辑函数之一。它允许你根据设定的条件比较一个值,然后根据比较结果是真(TRUE)还是假(FALSE)返回相应的结果。这些结果可以是文本值或数字值。
IF函数的基本逻辑是:如果某个条件成立,则返回一个值或执行一个操作;如果不成立,则返回另一个值或执行另一个操作。
例如,在我们的“车辆玩具销售”工作表中,如果想添加一列来记录订单是否已发货,可以执行以下操作:
- 在现有列的右侧添加一个新列,命名为“已发货”。
- 在单元格H2中输入公式:
=IF(G2="shipped", "Yes", "No")- 这个公式表示:如果G2单元格的文本是“shipped”,则返回“Yes”;否则返回“No”。
- 使用填充柄将此公式复制到整列。
我们还可以使用IF函数来强调订单的规模。例如,添加一个名为“3K以上/以下”的新列,并在单元格F2中输入公式:=IF(E2>3000, "Over 3K", "Under 3K"),然后复制到整列。
🧩 嵌套 IF 与 IFS 函数:处理多个条件
在理想情况下,IF函数只应处理一两个条件。但有时你可能需要应用多个条件。这时,可以利用函数的嵌套功能,将多个IF语句组合在一个公式中,即嵌套IF函数。
例如,要按销售额将订单分为“大”、“中”、“小”,可以在单元格F2中输入类似以下的嵌套IF公式:
=IF(E2>5000, "Large", IF(E2>2000, "Medium", "Small"))
这个公式包含多个IF函数,每个条件需要一个,因此需要三组括号,相对较长且复杂。
尽管Excel技术上支持在一个公式中嵌套多达64个不同的IF函数,但这并非推荐的最佳实践。复杂的嵌套公式难以管理和理解。


为了解决这个问题,Excel引入了IFS函数。IFS函数可以替代单个公式中使用的多个嵌套IF函数,从而简化操作。该函数仅在Excel 2019、Microsoft 365版Excel和网页版Excel中受支持。
使用IFS函数重写上面的例子,公式为:
=IFS(E2>5000, "Large", E2>2000, "Medium", TRUE, "Small")
这个公式只有一组括号和一个函数,更加简洁清晰。
🎨 结合 IF 函数与条件格式


现在,让我们看一个结合使用IF函数和条件格式的例子。
切换到“汽车销售”工作表,在“年转售价值”列右侧添加一个名为“保值率”的新列。在单元格G2中输入公式:=F2/E2(用年转售价值除以原始零售价),将其格式设置为百分比,并复制到整列。


接下来,添加一列来突出显示每辆车的保值情况。在单元格H2中输入公式:=IF(G2>0.69, "Good", "Poor"),然后复制到整列。
我们还可以使用条件格式进一步突出显示“保值率”:
- 选中H2单元格,在“开始”选项卡中点击“条件格式”,选择“新建规则”。
- 规则类型选择“只为包含以下内容的单元格设置格式”。
- 设置条件为:单元格值 等于
Good。 - 将格式设置为深绿色字体和浅绿色填充。
- 将此条件格式复制到整列。
现在,包含“Good”的单元格已按我们定义的格式显示。我们可以再添加一个规则,将包含“Poor”的单元格格式设置为红色字体和粉色填充。
📊 COUNTIF 与 COUNTIFS 函数:按条件计数

接下来,我们快速了解如何使用COUNTIF函数。COUNTIF是Excel提供的统计函数之一,用于计算满足特定条件的单元格数量。
例如,在“车辆玩具销售”工作表中,想知道有多少销售订单来自英国的客户。我们在单元格AD7中输入公式:=COUNTIF(C2:C100, "United Kingdom")。请注意,当使用文本作为条件时,必须将文本用引号括起来。
结果显示有6个英国订单。同样,我们可以计算法国客户(14个订单)和美国客户(41个订单)的数量。注意,文本条件不区分大小写。
此外,还有一个较新的函数叫COUNTIFS,它可以跨多个范围应用条件,统计所有条件均满足的次数。这避免了在单个复杂公式中使用多个COUNTIF函数。COUNTIFS函数同样仅在Excel 2019、Microsoft 365版Excel和网页版Excel中受支持。

➕ SUMIF 与 SUMIFS 函数:按条件求和
最后,我们来看看如何使用SUMIF函数,这是Excel中非常常用的数学函数。SUMIF函数用于对指定范围内满足特定条件的值进行求和。
例如,我们想计算所有总额超过3000美元的订单的总和。在单元格AD10中输入公式:=SUMIF(E2:E100, ">3000")。请注意,因为使用了算术运算符(大于号),所以必须将条件用引号括起来。如果条件只是一个数字,则不需要引号。

结果显示,超过3000美元的订单总额约为470,000美元。
你还可以在搜索部分匹配时使用通配符(如问号?和星号*),并且可以指定从与条件列不同的列中提取值进行求和。例如,公式 =SUMIF(B2:B100, "*Cars", E2:E100) 将对产品线以“Cars”结尾的所有行,在E列(销售额)中进行求和。
同样,也有一个较新的SUMIFS函数,可用于基于多个条件对单元格求和,避免了使用多个SUMIF函数的复杂公式。SUMIFS函数也仅在上述新版Excel中受支持。

📝 总结

本节课中,我们一起学习了Excel中四个强大的数据分析函数:
- IF 和 IFS 函数用于根据条件进行逻辑判断和返回结果。
- COUNTIF 和 COUNTIFS 函数用于按条件计数。
- SUMIF 和 SUMIFS 函数用于按条件求和。

掌握这些函数能让你更灵活地处理和解读数据。在下一个视频中,我们将学习如何使用VLOOKUP和HLOOKUP这两个引用函数。
049:使用 VLOOKUP 与 HLOOKUP 函数 📊
在本节课中,我们将学习如何使用 Excel 中的 VLOOKUP 和 HLOOKUP 这两个重要的查找与引用函数。它们能帮助你在表格中快速定位并提取所需的数据。
函数概述与基本概念
上一节我们介绍了 IF、COUNTIF 和 SUMIF 等条件函数,本节中我们来看看如何利用 VLOOKUP 和 HLOOKUP 进行数据查找。
VLOOKUP 是 Excel 中最常用的引用类函数之一,它允许你根据查找值在指定的查找表中检索数据。其名称代表“垂直查找”,因此当你需要按行在表格或区域中查找内容时,它是一个非常有用的工具。稍后我们将介绍 HLOOKUP,它代表“水平查找”,其工作原理是按列查找数据。
VLOOKUP 通过源数据与查找表数据之间的共享关键字段进行工作。
VLOOKUP 函数详解

一个典型的 VLOOKUP 公式结构如下:
=VLOOKUP(lookup_value, table_array, col_index_num, [range_lookup])
以下是公式中各个参数的含义:

lookup_value:查找值。即你想要查找的值或词语。table_array:查找表或区域。即包含查找值的单元格区域。在公式中,Excel 将其引用为table_array。查找表可以位于同一工作表或另一个独立的工作表中。col_index_num:列索引号。即查找表中包含你所需返回值的列序号。在公式中,Excel 将其引用为col_index_num。[range_lookup]:这是一个可选参数,用于决定匹配类型是精确匹配还是近似匹配。使用FALSE表示要求精确匹配,使用TRUE表示允许近似匹配。在公式中,Excel 将其引用为[range_lookup]。方括号表示该参数是可选的,而其他参数是必需的。如果你在公式中不指定这个可选参数,它将默认为FALSE,即要求精确匹配。你也可以用数字0代替FALSE,用数字1代替TRUE。
VLOOKUP 实战演练
现在让我们看看 VLOOKUP 函数的具体应用。
在“汽车销售”工作表中,假设我们想快速生成一份心仪汽车的价格清单。首先,我们需要将包含查找值的列置于最左侧,因为 VLOOKUP 要求如此。然后我们可以删除原始列。
接着,我们在单元格 V16 中输入公式。该公式在单元格 A2 到 G156 构成的 table_array 中查找词语“Corvette”,然后在匹配到“Corvette”所在的行中,返回第 5 列(在本例中是价格列)的值,结果为精确值 45705。
请注意,在此示例中,我们使用了现有数据表的一部分作为查找表或 table_array。
让我们将其格式设置为美元货币,并将小数位数设为零。
实际上,与其在公式中使用引用 A25,不如使用本工作表中我们心仪汽车列表小表格里“corvette”一词的引用,即 V5。这样公式仍然有效。
现在,让我们将该公式复制到工作表中上方的心仪汽车表格中。但出现了问题,因为当我们复制公式时,单元格引用发生了变化。
这是因为正如我们在本课程前面所学,单元格引用的默认状态是相对的,而在此例中我们需要它们是绝对的。因此,让我们撤销复制操作。
为了使单元格引用变为绝对引用,我们需要在公式中的所有单元格引用前添加美元符号 $。这可以手动完成,也可以将光标依次放在公式中的每个单元格引用上,然后按 F4 键自动添加美元符号。
让我们再次尝试复制公式。这次,它成功了。

如果我们使用单元格 W5 上的填充手柄将其向下复制到其余汽车,它并不奏效。实际上,每个单元格都得到了相同的结果。为什么?因为每个公式都引用了查找值中的相同单元格,因为我们使用了绝对引用。
我们现在需要做的就是修改公式,仅移除查找值部分中行参数的绝对引用,即删除美元符号。因此,在单元格 W5 中,我们将 $V$5 改为 $V5。然后当我们向下拖动填充手柄时,它将正确复制公式,所有价格都将更新以反映其正确的零售价。
最后,为了展示这两个表格现在通过 VLOOKUP 函数连接在一起,如果我们在主数据表的单元格 E25 中更改雪佛兰 Corvette 的零售价,心仪汽车价格列表中的价格也会相应改变。
HLOOKUP 函数介绍
现在让我们看看 HLOOKUP 函数。正如前面提到的,它的功能与 VLOOKUP 函数几乎相同,但它是按列而不是按行查找数据。
因此,HLOOKUP 在表格的首行中查找一个词或值,然后从 table_array 中指定的行返回同一列中的值。所以,如果你的比较值位于数据表顶部的行中,你会使用 HLOOKUP。相反,如果你的比较值位于你想要查找的数据左侧的列中(如上一个任务那样),则使用 VLOOKUP。
在这两个函数中,VLOOKUP 的使用频率远高于 HLOOKUP,这是由于大多数数据表的性质决定的。


HLOOKUP 的语法与 VLOOKUP 完全相同,只是你指定的是一个行索引号(在公式中 Excel 将其引用为 row_index_num)。这表示查找表中包含你所需返回值的行号。
HLOOKUP 实战演练
让我们在主数据表的右侧创建一个小型查找表。此工作表中隐藏了一些列以便于查看。

现在,我们的查找表顶行有了“低 HP”、“中 HP”和“高 HP”。接下来,我们将添加 Wingdings 符号作为三个马力等级的评分:1 个悲伤表情代表低马力评级,2 个中性表情代表中等评级,3 个笑脸代表高马力评级。
现在,让我们在“HP 等级”列的右侧添加一个新列,并将其命名为“HP 评分”。然后在单元格 L2 中输入 HLOOKUP 函数。此函数将查找单元格 K2 中的值(本例中为“中 HP”),并在单元格范围 Y21 到 AA22(即我们的小查找表)中查找它,然后返回它在表中“中 HP”下方第 2 行找到的答案,并使用精确值。请注意,我们在此公式中使用了一些绝对引用。
注意,返回的是文本“KK”,因此我们需要使用 Wingdings 字体格式化单元格。
现在,当我们双击填充手柄时,整列会显示与每行 HP 等级值相关的 HP 评分符号,这样我们就完成了。
关于 XLOOKUP 的说明
尽管 VLOOKUP 和 HLOOKUP 仍然是 Excel 中查找引用的常用函数,但有一个较新的函数叫做 XLOOKUP。此版本仅在 Excel 桌面版(从 Microsoft 365 版开始)、Excel 网页版以及 iPad、iPhone、Android 平板电脑和手机的 Excel 上受支持。
XLOOKUP 是 VLOOKUP 和 HLOOKUP 的改进和结合版本。它可以在任何方向(垂直或水平)上工作。它还使用独立的查找数组和返回数组值,而不是单一的表数组和列/行索引号。

课程总结

本节课中我们一起学习了如何在 Excel 中使用 VLOOKUP 和 HLOOKUP 函数,以在垂直和水平的查找表中查找并连接引用的数据。在下一课即将到来的视频中,我们将开始学习如何在 Excel 中使用数据透视表。
050:Excel数据透视表入门
在本节课中,我们将学习如何在Excel中创建和使用数据透视表。数据透视表是Excel中一个强大的数据分析工具,它能帮助我们快速汇总、分析数据,发现趋势和模式,并进行数据比较。
上一节我们介绍了VLOOKUP和HLOOKUP函数的使用,本节中我们来看看如何利用数据透视表进行更高效的数据分析。
🛠️ 准备工作:将数据格式化为表格
在创建数据透视表之前,先将原始数据格式化为Excel表格会非常有帮助。这样做不仅能使数据更整洁、美观,更重要的是,当向数据集中添加新记录时,表格格式能自动扩展,确保数据透视表的数据源始终完整。
以下是具体操作步骤:
- 在数据区域内选中任意一个单元格。
- 在“开始”选项卡的“样式”组中,点击“套用表格格式”。
- 从样式库中选择一个你喜欢的样式。
- 在弹出的对话框中,确认数据范围正确,并勾选“表包含标题”。
- 点击“确定”。
完成格式化后,你会看到每列顶部都自动添加了筛选下拉箭头。当你滚动到表格底部并开始添加新一行数据时,新行会自动被纳入表格范围。
✅ 创建数据透视表前的检查清单
为了确保数据透视表能正确工作,你的数据源需要满足一些条件。以下是创建前应检查的事项:
- 格式化为表格:如前所述,这是最佳实践。
- 确保列标题正确:数据源应只有一行标题,这些标题将成为数据透视表中的字段名。
- 删除空行和空列:并尽量消除空白单元格。
- 检查数值格式:确保数值字段的格式是“数字”而非“文本”。
- 检查日期格式:确保日期字段的格式是“日期”而非“文本”。
📈 创建并配置基础数据透视表
现在,让我们开始创建第一个数据透视表。

首先,在已格式化的表格中选中任意单元格。然后,切换到“插入”选项卡,点击“数据透视表”。默认情况下,Excel会自动识别表格范围(例如 表1)。我们选择将数据透视表放置在新工作表中。
一个新的空白工作表会打开,左侧是数据透视表区域,右侧是“数据透视表字段”窗格。
要构建数据透视表报告,我们需要将字段从窗格顶部拖拽到底部的不同区域(行、列、值)。例如,如果我们想查看每个汽车型号的总销售额:
- 将“制造商”字段拖到“行”区域。
- 将“型号”字段也拖到“行”区域,并放置在“制造商”下方,这样逻辑更清晰。
- 将“价格”字段拖到“值”区域。
- 将“单位销量”字段也拖到“值”区域。
现在,数据透视表就显示了每个型号的单价和销售数量。你可以尝试将其他字段(如“车辆类型”)拖到“列”区域,如果觉得不适用,可以通过拖拽字段移出区域或使用下拉菜单将其移除。
➕ 在数据透视表中执行计算
数据透视表不仅能汇总数据,还能进行动态计算。例如,我们当前的“价格总和”列显示的是通用数字格式。我们可以先将其格式化为美元。
这可以通过修改“值”区域中该字段的“值字段设置”来完成:将数字格式设置为美元,并隐藏小数位。
接下来,我们添加一个计算字段来求出每个型号的总销售额(价格 × 单位销量)。
- 点击数据透视表区域。
- 在出现的“数据透视表分析”选项卡中,点击“字段、项目和集”,然后选择“计算字段”。
- 在弹出的对话框中,为字段命名(例如“型号总销售额”)。
- 在公式框中输入:
=价格 * 单位销量 - 点击“添加”,然后“确定”。

这个名为“型号总销售额”的新字段会自动添加到字段列表和“值”区域。我们可以再次将其格式化为美元。现在,数据透视表中出现了一个新列“型号总销售额的总和”。例如,我们可以看到“Acura Integra”型号的销售额超过3.6亿美元,而“Acura TL”型号的销售额超过10亿美元。
📝 课程总结
本节课中我们一起学习了:
- 如何将数据格式化为Excel表格,为创建数据透视表做好准备。
- 如何创建数据透视表,并通过拖拽字段到行、列、值区域来分析和组织数据。
- 如何在数据透视表中执行计算,例如添加计算字段来生成新的汇总指标。
数据透视表是一个动态工具,当源数据发生变化时,分析结果也会自动更新,这使它成为数据分析师呈现数据洞察的利器。

在下一个视频中,我们将进一步探索数据透视表的其他高级功能。
051:透视表的多视角应用

在本节课中,我们将聆听几位数据专业人士分享他们使用透视表分析数据的经验。透视表是Excel中一个强大的工具,能够帮助我们从不同维度快速理解和汇总数据。
🎤 专业人士的透视表经验分享
以下是几位数据从业者结合自身经历,对透视表实用性的看法。
数据分析师 1:
我的Excel透视表使用经验非常丰富,我一直在使用它。需要记住的是,你可以轻松地进行求和、求平均值和计数。你可以设置分组依据,让他人在顶部选择参数。如果你有几千条甚至Excel能处理的任意数量的记录,透视表都是一个非常简单的操作方式,无需进行任何实际的查询或使用开发语言。
电商数据分析师:
我曾处理过一个庞大的电子商务销售数据集。我需要分析关键绩效指标,包括商品交易总额和佣金率。然而,如果只停留在宏观层面,我只能获得有限的洞察。借助透视表,我能够按国家、商店类型和产品类型对数据进行分组,这使我能够从不同粒度查看数据并分析关键绩效指标。
审计领域专业人士:
我们在公司中使用透视表,特别是在审计期间,它协助并帮助我们深入挖掘数据。因为透视表的作用是帮助你处理大量数据,并将其提炼成有意义的信息。以审计为例,一个客户可能有价值50万美元的维护和维修账单,这些账单由300美元的发票组成。我们不想查看每一张每一美元的发票,我们想看的是高额发票。因此,我们将使用透视表来缩小范围,聚焦那些对财务报表实际影响最大的发票。
数据项目顾问:
可以说,Excel透视表是快速有效理解数据的好方法。只需打开一个Excel工作表,将其放入透视表,通过拖放操作来感受数字的样子和数值的大小,这真的能帮助你很好地理解数据,以便开始构建更稳健的分析。能够理解字段的含义和外观,这些都能在项目初期帮助你进行分析。透视表对于快速查看数据、从多个层面审视数据非常有用,而且方式快捷、清晰。在一组原始数据上创建透视表,按某个感兴趣的层级(例如国家、用户所在国家、用户加入年份或其他任何维度)进行聚合,这非常简单。它非常适合快速查看和理解隐藏在数据中的一些更高级别的摘要。

💎 本节总结
本节课中,我们一起聆听了多位数据专业人士分享他们使用Excel透视表的实际经验。通过这些分享,我们了解到透视表的核心价值在于:它能将庞杂的原始数据快速聚合、分组和汇总,让使用者无需复杂编程即可从不同维度(如国家、产品类型、时间等)灵活地探索数据,快速获得高层级的洞察,从而为更深度的分析奠定基础。无论是处理日常报表、进行电商数据分析,还是执行专业的审计工作,透视表都是一个不可或缺的效率工具。
052:数据透视表高级功能
在本节课中,我们将学习数据透视表的一些高级功能,包括“推荐的数据透视表”、筛选器、切片器和时间线。这些工具能帮助你更高效地分析和探索数据。
🔍 推荐的数据透视表
上一节我们介绍了如何创建和使用数据透视表。本节中,我们来看看“推荐的数据透视表”功能。这并非一个独立的功能,而是一个基于所选数据、提供不同数据组合建议的列表。如果你对数据透视表经验不多,这是一个很好的起点。
例如,在“车辆玩具销售”工作表中,如果我们选中包含“订单数量”数据的B列,然后从“插入”选项卡选择“推荐的数据透视表”,系统会呈现一系列与订单数量信息相关的潜在数据组合。


然而,如果我们选中包含“订单规模”信息的F列,推荐的列表就会反映该数据。同样,选中包含“销售额”数据的E列,推荐的数据透视表就会与销售数据相关。
我们选择列表中的第三个选项:“按地区汇总的销售额”。这听起来能通过数据透视表获得有用的见解。
请注意,系统会打开一个包含推荐数据透视表的新工作表,同时右侧会打开一个名为“数据透视表字段”的新窗格。我们将工作表重命名为更有意义的名称。
在“数据透视表字段”窗格中,可以看到一些字段已自动添加到“行”和“值”区域。虽然是推荐的数据透视表,我们仍然可以通过添加更多字段来自定义它。例如,让我们使用拖放操作将“产品线”字段添加到“列”区域。现在,数据透视表中为每条产品线(如摩托车、轮船和火车)都设置了单独的列。
在数据透视表中,我们可以手动展开任何字段以查看其内容。这里可以看到,订单日期位于数据透视表中地区名称的下方。请注意,这与“数据透视表字段”窗格中“行”区域的字段顺序相匹配。
我们也可以手动折叠每个字段,但同时也有一次性展开或折叠所有字段的选项。
🎯 数据透视表筛选
接下来我们将深入探讨数据透视表筛选功能。数据透视表筛选器的工作方式与本课程前面使用的标准筛选器非常相似。
请注意,这个数据透视表中已经内置了一些筛选功能。例如,“行标签”标题就是一个筛选器,我们可以像使用标准筛选器一样,筛选列出的任何地区(如日本)。清除数据透视表中的筛选器也非常简单。
我们还有一个“列标签”筛选器,允许我们筛选此数据透视表中的任何产品线项目。例如,我们可以只显示“火车”产品的数据。
我们还可以选择将“产品线”字段作为标准筛选器(而非列标题)添加到数据透视表中。方法是在“数据透视表字段”窗格中将其拖到“筛选器”区域。然后,就可以像本课程前面所做的那样,将其用作标准筛选器。该筛选器还允许我们选择多个筛选项目。
但是,因为它现在被用作标准筛选器而不是列标题,所以我们无法看到这两个产品线上信息的拆分,只能看到合并的总计。而当筛选器作为列标题时,每个产品线的信息会分别显示在各列中。
让我们再次显示所有字段总计,并将“产品线”字段拖回之前的“列”区域,以便在数据透视表中看到不同产品线的拆分情况。
🧩 切片器
下一个要介绍的数据透视表功能是切片器。切片器本质上是屏幕上的图形化筛选对象,让你能够使用按钮来筛选数据。
切片器可以轻松快速地对数据透视表数据进行筛选,并且能显示当前的筛选状态,让你更容易了解和查看当前显示的数据以及被筛选隐藏的数据。
例如,如果我们通过将“产品线”字段拖出“数据透视表字段”窗格来将其从数据透视表中移除,然后从“数据透视表分析”选项卡点击“插入切片器”,并选择“地区”字段作为切片器。
可以看到,切片器可以在工作表的任何位置自由移动,并且包含每个地区名称(如EMEA、北美和日本)的按钮。如果需要,我们还可以选择“多选”按钮来筛选多个地区。我们可以点击“清除筛选器”按钮来清除所有切片器筛选。
让我们为“产品线”字段再添加一个切片器到工作表中。但是,请确保首先选中数据透视表中的一个单元格,否则“插入切片器”按钮将不起作用。
请注意,切片器也可以从“插入”选项卡的“筛选器”组添加,同样可以从“数据透视表分析”选项卡添加。这次我们选择“产品线”字段作为切片器,并将其拖到工作表的顶部附近。
和之前一样,我们可以只选择一个切片器项目,也可以开启“多选”并选择多个项目在切片器中进行筛选。
然后清除切片器筛选,现在让我们同时使用两个切片器进行筛选。
请注意,当使用多选筛选时,选择一个项目实际上是将其筛选出来。也就是说,你定义的是哪些项目将不会显示在数据透视表中。这与在切片器中选择单个项目时的行为相反。
所以,现在我们只显示EMEA和北美地区关于经典汽车、火车以及卡车和公共汽车产品的数据。
现在,让我们清除这些切片器筛选,并将“产品线”字段放回数据透视表的“列”区域,为接下来要探索的功能做好准备。

让我们把这些切片器移到工作表下方更远的位置。
📅 时间线
我们要了解的最后一个有用的数据透视表功能是时间线。时间线是另一种筛选工具,使你能够专门针对数据透视表中与日期相关的数据进行筛选。
这是一种比在日期列上创建和调整筛选器更快捷、更有效的动态日期筛选方式。

我们可以从“数据透视表分析”选项卡或“插入”选项卡为数据透视表添加时间线。再次强调,请确保先选中数据透视表中的任意单元格。
首先,我们选择“订单日期”字段作为时间线筛选器。

然后我们可以将其拖到工作表上方并放大。

此时间线的默认设置是按月显示数据,但你也可以按天或按季度筛选。你可以选择单个季度,也可以选择一个季度范围。在本例中,我们选择2003年第3季度到2004年第2季度之间的12个月。
你可以使用“清除筛选器”按钮清除时间线筛选。你也可以按年份筛选。例如,这里我们只选择了2003年。


你可以在数据透视表中将切片器和时间线结合使用作为筛选器。例如,这里我们可以筛选切片器,只显示EMEA和北美地区在2003年关于“火车”产品的数据。
如果我们改为筛选2004年,你会看到没有数据显示,这意味着在2004年,EMEA或北美地区都没有火车产品的销售。
当你选中时间线或切片器时,功能区会出现它们各自的选项卡,可以修改其属性以改变外观和工作方式。例如,让我们将这个时间线改为浅绿色阴影。
再把这个切片器改成漂亮的橙色。最后,要删除时间线或切片器,可以选中后按Delete键,或者右键点击并选择“剪切”。
📝 总结
在本节课中,我们一起学习了Excel中可与数据透视表配合使用的一些其他功能,即推荐的数据透视表、筛选器、切片器和时间线。这些工具能极大地增强你分析和呈现数据的能力。



浙公网安备 33010602011771号