数据分析与企业数据分析方向
离线分析 批处理
实时分析
机器学习
数据分析基本流程步骤
1.明确分析目的和思路
2.数据收集
3.数据处理
4.数据分析
5.数据展现
6.报告撰写
大数据时代
特征:
1.数据体量大
2.种类、来源多样化
3.低价值密度
4.速度快
5.数据的质量
分布式与集群概念
分布式:多台机器,每台机器上部署不同组件
集群:多台机器,每台机器上部署相同组件
分布式存储数据
分布式计算