管理信息系统——006 BI商务智能
信息链(层层递进)
Facts(事实):自然家、人类思维和社会活动的客观映射
Data(数据):事实的数据化、编码化、序列化、结构化
Information(信息):数据在信息媒介上的映射
Knowledge(知识):对信息的加工、吸收、提取、评价的结果
Intelligence(智能):运用知识的能力
两类信息系统


商务智能的高层架构
包括数据仓库、商务分析、业务绩效和用户界面

数据仓库的体系结构

商务分析的类型
描述性分析:
报告分析:发生了什么?
对历史数据的回顾性分析
- 联机分析处理/数据仓库
- 数据可视化
- 描述性统计
预测性分析:
报告分析:未来发生什么?
通过分析历史数据,以预测未来
- 数据挖掘
- 文本/网络挖掘
- 预测(时间序列)
规范性分析:
报告分析:确定最优方案?
以描述性/预测性分析为基础
- 优化
- 模拟
- 多标准决策建模
- 启发式编程

商务分析的价值视角

商务分析的信息链视角

数据可视化的重要性
视觉上人类获得信息的最主要途径
视觉感知是人类大脑的最主要功能之一,眼睛是感知信息能力最强的人体器官之一。
统计学与数据可视化之间的不替代性
可视化处理结果的解读对用户知识水平/专业背景的要求较低
可视化能够帮助人们提高理解与处理数据的效率
可以洞察统计分析无法发现的结构和细节
商务可视化的类型
数据可视化

过程可视化

结果可视化

商务智能过程

第一步:理解业务问题
step 1 梳理业务目标,明确自变量和因变量
第二步:理解数据
理解数据的结构化程度,是结构化数据(二维表),还是半结构化数据(网页),还是准结构化数据(关键词),还是非结构化数据(视频)
第三步:数据准备(预处理)
第四步:数据挖掘与机器学习
常用的分析方法包括分类、聚类、关联分析、数值预测、序列分析、社会网络分析等
数据挖掘的多学科交叉属性

数据挖掘的基本思想

机器学习的基本思想

机器学习PET
如果一个计算机系统在完成某一个/类任务T的性能P能够随着经验E而改进,则称该系统在从经验E中学习,并将此系统成为一个学习系统。随着任务的不断执行,经验的累积会带来计算机性能的提升。

机器学习的类型
监督式学习(supervised learning)
无监督学习(unsupervised learning)
强化学习(reinforcement learning)
数据挖掘的基本类型问题
聚类分析
将数据对象,根据其特征自然分成不同类别
预测估计
根据已知连续数据对象,围绕已知维度,构建模型,对未知对象估值
关联分析
通过数据对象之间的相关关系,发现对象之间的联系
分类模型
针对已知类别,构建分类模型,探求未分类对象的类别

浙公网安备 33010602011771号