学习笔记: 业务数据分析
2021/8/6
分析常用方法论:
相关性分析法
定性->定量识别关键行为, 衡量相关关系、因果关系,判定影响阈值
漏斗分析法
梳理转化流程,找到转化瓶颈
用户画像分析
例如, 通过RFM模型对用户价值进行分类
- 重要价值用户: R 低, F 高, M 高, 这种用户价值度非常高, 因为忠诚度高, 付费频次高, 又很土豪
- 重要召回用户: R 低, F 低 M 高, 因为付费频次低, 但金额高, 所以是重点召回用户
- 重要发展用户: R 高, F 低, M 高 因为忠诚度不够, 所以需要大力发展
- 重要挽留用户: R 高 F 低 M高 因为 忠诚度和活跃度都不够 很容易流失 所以需要重点挽留
其中,RFM模型指用户的:Recency最近一次消费日期, Frequency消费频率,Monetary消费金额
2021/8/5
source:PM和DS必须懂得数据运营指标搭建 (qq.com)
指标体系搭建
一、工作流:
1.指标规划
- 明确并拆解业务目标
- 维度设置
- 更新周期
- 指标定义
- 输出:有哪些指标,对应数据获取的难易程度,难获取的关键数据如何寻找间接的采集方法或替代数据
2.数据采集
- 上报字段、分类、规范、时机
3.报表呈现
- 单个报表内:维度和指标(口径)是否准确,是否完备,服务于哪些业务目标
- 多个报表间:报表间的关系
4.数据产品
- 指标监控
- 上卷下钻
- 自助提取
- 异常告警
二、应用:
指标异动分析,漏斗转化分析,用户画像洞察
2021/8/4
数据如何赋能产品—Magic Number (qq.com)
问题: 如何通过数据帮助产品发现影响留存的关键行为
目标: 找出影响留存的关键行为, 度量影响大小, 并判断是否有因果关系
分析思路:
1.关键行为提取 -> 2.行为 & 留存的相关性 -> 3.因果关系 -> 4.行为magic number
具体地:
- 通过用户旅程定性分析, 列举与留存可能高度相关的行为, 然后用sql提取数据
- 计算各行为与留存的相关系数
- 相关关系不能推出因果关系. 这里引入Granger causality test进行推断
- 若已经判断某行为是留存的原因, 例如一周刷抖音的时间是下一周是否会留存的原因, 那么接下来还需要去发现刷多长时间才是留存的magic number.
换言之, 即我们需找到与目标行为是因果关系的关键行为, 并且给出促成因果关系成立的"阈值"(magic number)
案例: 某直播app的留存分析.
1. 与留存相关的行为主要有: 登录行为, 观看行为, 互动(弹幕)行为, 付费行为
2. 计算各行为与留存的相关性, 依据相关系数大小排序选出前n个行为, 例如:30天内的:登录天数、观看品类个数、观看主播数、日均观看时长
3. 格兰杰因果关系检验两个行为之间是否有因果关系
检验原理:两个变量X、Y之间的格兰杰因果关系定义为:
若在包含了变量X、Y的过去信息的条件下,对变量Y的预测效果要优于只单独由Y的过去信息对Y进行的预测效果,
即变量X有助于解释变量Y的将来变化,则认为变量X是引致变量Y的格兰杰原因
原假设: X 和 Y 不存在因果关系.
检验方法:给定显著性水平为0.05时,当经过格兰杰因果检验后计算出来的 p 值大于0.05 则接受原假设, 否则拒绝原假设
代码实现:python的statmodels包提供了该检验函数:
from statsmodels.tsa.stattools import grangercausalitytests
4. 发现了影响留存的关键原因之后, 可以通过行为指标-留存率的可视化曲线, 判断曲线趋势变化的阈值, 从而得到magic number
2021/8/2
AARRR指标体系
Acquisition 拉新:
- 浏览量(渠道曝光量)、点击量、下载量(安装次数)
- 新增用户数(新增注册用户)、新客留存率
- 获客成本:CPM、CPC、CPA
Activation 活跃:
- DAU:当日活跃用户数
- MAU:当月至少活跃一次的用户数
- WAU:当周至少活跃一次的用户数
注意:我们知道用户生命周期可分为:引入期,成长期,成熟期,沉默期,流失期。
依此可以将活跃用户细分成: 新增、持续活跃、沉默复活、流失复活用户
——————————————————————————————
补充基本概念:
离开业务的数据毫无价值。无论哪种互联网细分行业的业务都是基于解决“用户在某种场景下,产生的某种需求”。梳理有哪些业务数据,也就是要回答三个问题:谁?做了什么?结果怎样?于是我们可以将数据分为三大类:
- 用户数据(谁)
- 行为数据(做了什么)
- 业务数据(结果怎么样)
用户数据主要有:DAU,MAU,新增用户,留存率。
用户:
(1)认人
即用户数(user)=访问过服务的ID数
(2)认设备
即用户数=访问过服务的设备数
ios采用IDFV,安卓可基于多种ID拼接,有IMEI、Android ID、WLAN MAC、蓝牙MAC等
活跃: (1)基于第三方数据平台 今天上报过事件(特指用户进行了主动操作的行为)->这个用户就活跃的 (2)基于公司自己的数据平台 用户执行了关键事件->这个用户是活跃的
新增用户:
不同的节点事件都可以作为一次新增,包括:点击渠道链接进入页面、下载、安装启动、激活。
按不同的事件进行新增活跃用户的计数,的对渠道方、应用开发方来说各有优缺点,有不同的适用场景。
留存:
如何计算新增用户七日留存?
这里给出三个算法:
算法一(又称七日日留存):(第七天留存用户数/第一天新增用户数)*100%
算法二(又称七日内留存):(第二天~第七天去重后的留存用户数/第一天新增用户数)*100%
算法三(消除周几影响):(第八天留存用户数/第一天新增用户数)*100%
注意:根据不同场景和要求适用不同的算法
source:数据扫盲(1):我们常说的DAU、MAU是啥? | 人人都是产品经理 (woshipm.com)
数据扫盲(2):新增用户与留存到底是啥? | 人人都是产品经理 (woshipm.com)
——————————————————————————————
Retention 留存
- 留存率:七日日留存、七日内留存
- 流失率:统计周期内登陆的用户中,下一个周期未登陆的用户占比
- 用户生命周期
LT = 当日留存率 + 次日留存率 + ... + n日留存率
Revenue 转化
- 社区类:培养一个能产生内容的活跃用户社区
- 内容生成者
- 内容生成用户总量
- 内容生成比例 = 内容生成用户/用户总量 (-> 体现产品的内容生成健康度)
- 内容互动者
- 内容互动用户总量
- 内容互动比例 = 内容互动用户总量/用户总量 (-> 体现产品的用户参与度)
- 内容生成者
- 交易类 核心在于成交
- GMV、成交额、销售收入(扣除退款)
- 付费用户数、付费率
- ARPU(Average Revenue Per User)、ARPPU(Average Revenue Per Paying User)
- 复购率:复购率 = 周期内消费两次及以上的用户/用户总量
- 企业型
- 体验用户数、付费用户数
- 付费率 = 付费用户数/体验用户数
- 追加销售数、追加销售率 = 追加销售数/总付费用户数
- ARPU、ARPPU
- 客户终身价值
Refer 传播
- 病毒k因子
- 邀请率 = 发出的邀请数 / 现有用户数
- 转化率 = 新注册数 / 邀请数 (转化率是指被感染用户(接到邀请的用户)转化成新用户的比例)
- k = 邀请率 * 转化率 (= 新注册数/现有用户数) (-> 当k>1时,形成自传播)
- 病毒传播周期
- 是指从用户发出邀请,到新用户完成转化(如点击阅读、注册、消费的行为)所花费的时间。
- 缩短周期的措施: 首先尽可能减少用户的操作成本; 其次可以增加用户的紧迫感
- 净推荐值 = 推荐者数/总样本数 - 贬损者数/总样本数
产品日活DAU下降分析
source: https://zhuanlan.zhihu.com/p/116017580
- 第一步: 确认数据真实性
确定是否是数据报表统计或者数据源头的问题
- 第二步: 分维度确定异常原因
常见维度: 新老用户, 登陆平台, 版本, 入口, 登陆渠道, 区域, 时间(假期,日夜,产品周期性)
并计算影响系数:每一项数据都要和以往正常值做对比,算出影响系数。
影响系数 = (今日量-昨日量)/(今日总量-昨日总量)
or
影响系数 = 某维度下变化量/总变化量
例如: 老用户影响系数=(77.89-78)/(78.8-79.5)=0.16; 新用户影响系数=(0.98-1.5)/(78.8-79.5)=0.84
影响系数越大,说明此处就是主要的下降点
- 第三步:异常范围定位后,进一步做假设
假设维度:
产品侧:功能, 策略方面
技术侧:系统性能, 加载速度, 关键行为路径上是否出现重大bug
运营侧:运营策略, push效果, 拉新渠道, 投放推广, 近期活动
1.2 选好数据指标的通用方法论
三部曲
1.从业务的最终目的出发梳理业务模块
拆解:多问几个how
目的:我要卖货
手段:通过图文来买货
支撑手段的手段:通过社区创作的优美的图文来卖货
2.判断业务模块所属类型

3. ?
电商类app指标体系
KPI模块: 收入等
用户模块: 支付/新消用户数, ARPU, 注册用户数, 复购率
流量模块: PV, UV, 转化率=支付人数/访问UV
商品模块: 销售额, SKU数, SPU数
仓配模块: 妥投运单量, 揽收及时率, 出库量
供应链模块: SKU缺货率, 库存周转率

浙公网安备 33010602011771号