笔记 - 数据分析
数据分析的定义
- 一般是指用适当的统计方法,例如搭建模型,对收集来的大量数据进行处理,提取有用信息和形成结论的过程。
数据分析在商业领域的应用
- 借助统计编程,设计、开发来管理海量数据,创建可视化信息,以此方式帮助决策者作出更好的商业决策
- 从结构化和非结构化的来源研究和提取有价值的信息,解释过去的、现在的和将来的经营业绩,确定最佳分析模型和途径,为商业用户提供和解释解决方案
商业数据分析的核心竞争力
- 建模能力
- 软件的应用能力
- 优秀的数据表达能力
数据分析行业的趋势
- 大数据产业正从新兴期发展到快速增长期
- 创新成为大数据发展主要基调
- 大数据与各大产业融合将加速
- 数据分析的潜力在不断增长
- 数据分析的应用范围和机遇仍在扩展
数据分析后的三个主要职业发展方向
- 商业分析师
- 描述性分析
- 预测性分析
- 指导性分析
- 数据科学家
- 数据分析师
什么是大数据/商业数据分析
- 大数据的4V特点
- Volume,大量
- Velocity,高速
- Variety,多样
- Veracity,真实
数据分析整体流程
- 明确问题:明确问题是数据分析的第一步,必须明确数据分析的真实需求,确定分析的目的和方向
- 理解数据:数据获取和数据探索,结合业务,对数据理解透彻
- 数据清洗:一个数据分析项目大部分时间花在数据清洗上,对数据进行预处理,包括缺失值、异常值和重复值的处理
- 数据分析和可视化:按照相关方法,对清洗后的数据进行分析,并且通过可视化展示出结果
- 结论和建议:对结果进行解读,得出有价值的结论并且提出相关建议
做好数据分析需具备的知识
- 数学知识
- 各类分析工具
- 编程语言
- 数据可视化
做好数据分析需具备的能力
- 对于业务本身的理解能力
- 逻辑思维能力
- 沟通协调能力
- 快速学习能力
商业理解能力
商业分析整体流程
- 明确分析目标
- 数据收集
- 数据清理
- 数据分析
- 数据报告
- 执行与反馈
商业理解能力的提高方法
- 商业数据分析
- 商业理解能力
- 能力培养方法
- 点:构建事实基础
- 线:建立关联对比
- 面:找出异同,理解共性
- 战略分析模型
- SWOT
- 波特五力
- 能力培养方法
- 数据分析能力
- 数据收集
- 数据清理
- 数据分析
- 数据报告
- 商业理解能力
如何提高积累效率,快速培养理解能力
- 根据问题属性搭建一个框架,并善于应用
- 提高获取信息的质量,且持之以恒
- 养成每天看数据和报告的习惯
数据分析方法
- 常用统计方法,例如计算常用统计量和构建相关指标
- 图表法,通过各种图形结合来展示数据信息
- 机器学习算法,对于复杂的分析,会涉及到模型构建
RFM模型
- 用户分类(RFM模型),对比分析不同用户群体在时间、地区等维度下交易量,交易金额指标,并根据分析结果提出优化建议
- R:最近一次消费时间(最近一次消费到参考时间的长度)
- F:消费的频次(单位时间内消费了多少次)
- M:消费的金额(单位时间内总消费金额)
电商项目分析方法
- 用户行为分析
- 日访问量分析(UV分析)
- 小时访问量分析(UV分析)
- 不同行为类型用户pv分析
- UV,访客量分析
- PV,页面浏览量分析
- 用户消费行为分析
- 用户购买次数情况分析
- 日ARPPU(某时间段内平均每个付费用户为应用创造的收入)
- 日ARPU(某时间段内平均每个活跃用户为产品创造的收入)
- 付费率
- 同一时间段用户消费次数分布
- 复购情况分析
- 所有复购时间间隔消费次数分布
- 不同用户平均复购时间分析
- 漏斗流失分析(漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型)
- 用户行为与商品种类关系分析
- 不同用户行为类别的转化率
- 不同用户行为类别的感兴趣率
- 二八理论分析
- 用户价值RFM分析
互联网金融项目分析方法
- 逾期用户画像
- 用户基本信息分析
- 用户行为信息分析
- 不良率分析
- 随记录时间变化趋势
- 与年龄、性别的相关性
- 与初始评级的相关性
- 与借款信息的相关性
SWOT战略分析模型
- S,strength,企业优势
- W,weakness,劣势
- O,opportunityh,机会
- T,threats,威胁
SWOT战略分析不同类型组合
- 优势-威胁(ST)
- 企业利用自身优势,回避或减轻外部威胁所造成的影响
- 优势-机会(SO)
- 一种发展企业内部优势与利用外部机会的战略
- 当企业具有特定方面的优势,而外部环境又为发挥这种优势提供有利机会时,可以采取该战略
- 弱点-机会(WO)
- 利用外部机会来弥补内部弱点,使企业改劣势而获取优势的战略
- 弱点-威胁(WT)
- 一种旨在减少内部弱点,回避外部环境威胁的防御性技术
波特五力战略分析模型
- 供应商
- 潜在的新进入者
- 销售者间的竞争
- 替代品的其他产业
- 购买者
供应商的议价能力
- 供应商行业是否存在强烈的竞争
- 供应商的产品是否具有一定特色,难以被替代
购买者的议价能力
- 购买者的数量和购买数量
- 卖方行业是否由大量相对来说规模较小的企业所组成
- 购买者所购买的是否为标准化产品,即便同时向多个卖主购买产品,在经济上也完全可行
竞争性进入者威胁的严重程度的决定因素
- 进入新领域的障碍大小
- 规模经济、产品差异、资本需要、转换成本、销售渠道开拓、政府行为与政策
- 不受规模支配的成本劣势
- 自然资源
- 地理环境
- 与预期现有企业对于进入者的反应情况
源于替代品的竞争对现有企业的竞争战略的影响
- 现有企业产品售价以及获得潜力的提高将受到限制
- 企业的销量与利润增长的目标将有可能受挫
- 源自替代品生产者的竞争强度,受产品买主转换成本高低的影响
行业中现有企业之间竞争的加剧
- 行业进入障碍较低,势均力敌的竞争对手较多,竞争参与者范围广泛
- 市场趋于成熟,产品需求增长缓慢
- 竞争者企图采用降价等手段促销
- 竞争者提供几乎相同的产品或服务,用户转换成本很低
如何对付五种竞争力量
- 尽可能地将自身的经营与竞争力量隔绝开来
- 努力从自身利益需要出发影响行业竞争规则
- 先占领有利的市场地位再发起进攻性竞争行动
数据分析报告
- 数据报告的框架
- 架构清晰、主次分明
- 逻辑性强
- 提出解决和建议方案
- 结论明确
- 可读性强
- 简洁明了
- 通俗易懂
- 图表化呈现
数据分析常用软件
- EXCEL,是最简单的,具备一些基础的数据分析功能,可实现回归分析
- R语言,是最有代表性的一门统计分析软件
- Python,是较为通用的编程语言,在科学和工程领域应用广泛,是综合功能最强大的

浙公网安备 33010602011771号