Data Mining Tutorial -- 简明译文Part 01
概述
数据挖掘被定义为从大量数据集中提取信息的过程。换句话说,我们可以说数据挖掘是从数据中挖掘知识。本教程从基本概述和数据挖掘中涉及的术语开始,然后逐步介绍知识发现,查询语言,分类和预测,决策树归纳,聚类分析以及如何挖掘Web等主题。
读者
本教程是为计算机科学毕业生准备的,旨在帮助他们理解与数据挖掘相关的基本到高级概念。
前提
在继续学习本教程之前,您应该了解基本的数据库概念,例如模式,ER模型,结构化查询语言和数据仓库概念的基本知识。
第一章 Overview
信息产业中有大量数据可用。在将数据转换为有用信息之前,此数据无用。有必要分析这些大量数据并从中提取有用信息。
提取信息不是我们需要执行的唯一过程;数据挖掘还涉及其他过程,如数据清理,数据集成,数据转换,数据挖掘,模式评估和数据表示。一旦所有这些过程结束,我们就可以在欺诈检测,市场分析,生产控制,科学探索等许多应用中使用这些信息。
什么是数据挖掘?
数据挖掘被定义为从大量数据集中提取信息。换句话说,我们可以说数据挖掘是从数据中挖掘知识的过程。提取的信息或知识可用于以下任何应用程序:
- 市场分析
- 欺诈识别
- 客户保有
- 产品控制
- 科学探索
数据挖掘应用
数据挖掘在以下领域非常有用:
- 市场分析与管理
- 公司分析&风险管理
- 欺诈识别
除此之外,数据挖掘还可用于生产控制,客户保有,科学探索,体育,占卜和网络冲浪辅助等领域。
市场分析与管理
下面列出了使用数据挖掘的各个市场领域:
- 客户分析 - 数据挖掘有助于确定哪类人购买何种产品。
- 确定客户需求 - 数据挖掘有助于为不同客户确定最佳产品。它使用预测来找出可能吸引新客户的因素。
- 跨市场分析 - 数据挖掘执行产品销售之间的关联/关联。
- 目标营销 - 数据挖掘有助于找到具有相同特征的模型客户群,例如兴趣,消费习惯,收入等。
- 确定客户购买模式 - 数据挖掘有助于确定客户购买模式。
- 提供摘要信息 - 数据挖掘为我们提供了各种多维摘要报告。
企业分析与风险管理
数据挖掘用于公司部门的以下领域:
- 财务规划和资产评估 - 它涉及现金流量分析和预测,用于评估资产的或有索赔分析。
- 资源规划 - 包括总结和比较资源和支出。
- 竞争 - 它涉及监控竞争对手和市场方向。
欺诈识别
数据挖掘还用于信用卡服务和电信领域以检测欺诈。在欺诈电话中,它有助于找到呼叫的目的地,呼叫的持续时间,一天或一周的时间等。它还分析偏离预期规范的模式。

浙公网安备 33010602011771号