数据分析101
生活的背后数数据,数据的背后是算法
如何表示A数据比B数据好?
为什么需要数据分析? 数据分析可以为我们带来什么?
- 通过数据分析,可以更好的了解用户画像,为企业做留存率,流失率等指标分析,进而精细化产品运营。
- 通过数据分析可以让自己更加理智处理生活难题
- 我们生活在一个数据时代,数据挖掘和数据分析就是这个时代的“淘金”
- 数据分析可以让我们知道在哪里画那一条价值不菲的线
什么是数据分析?数据分析包括哪些方面?
- 数据采集: 去菜市场买菜
- 数据挖掘: 洗菜,择菜
- 数据可视化:做好的饭菜,端上餐桌可以吃了
数据采集如何获取需要的数据?
数据挖掘如何从海量数据中找到有用的信息?
数据挖掘的基本步骤 - 商业理解:业务方需要哪些数据
- 数据理解: 哪些数据和业务方有关
- 数据准备:对数据进行初步筛选
- 模型建立:对业务方的需求加tag
- 模型评估:和业务方确认 tag 是否准确
- 上线发布:
数据挖掘需要的数学知识
- 分类算法 :C4.5, 朴素贝叶斯,SVM, KNN, Adiboost, CART
- 聚类算法: K-Means, EM
- 关联分析法: Apriori
- 连接分析法:PageRank
- 概率论与数理统计 + 线性代数 + 图论 + 最优化方法
如何撰写数据分析报告 - 数据分析报告框架
参考书单
- 《精益数据分析》
- 《刷新》
- 《原则》《一网打尽》
- 《从优秀到卓越》