学习笔记: 业务数据分析

2021/8/6

分析常用方法论:

相关性分析法

定性->定量识别关键行为, 衡量相关关系、因果关系,判定影响阈值

漏斗分析法

梳理转化流程,找到转化瓶颈

用户画像分析

例如, 通过RFM模型对用户价值进行分类

  • 重要价值用户: R 低, F 高, M 高, 这种用户价值度非常高, 因为忠诚度高, 付费频次高, 又很土豪
  • 重要召回用户: R 低, F 低 M 高, 因为付费频次低, 但金额高, 所以是重点召回用户
  • 重要发展用户: R 高, F 低, M 高 因为忠诚度不够, 所以需要大力发展
  • 重要挽留用户: R 高 F 低 M高 因为 忠诚度和活跃度都不够 很容易流失 所以需要重点挽留

其中,RFM模型指用户的:Recency最近一次消费日期, Frequency消费频率,Monetary消费金额

 

 

2021/8/5

source:PM和DS必须懂得数据运营指标搭建 (qq.com)

指标体系搭建

一、工作流

1.指标规划

  • 明确并拆解业务目标
  • 维度设置
  • 更新周期
  • 指标定义
  • 输出:有哪些指标,对应数据获取的难易程度,难获取的关键数据如何寻找间接的采集方法或替代数据

2.数据采集

  • 上报字段、分类、规范、时机

3.报表呈现

  • 单个报表内:维度和指标(口径)是否准确,是否完备,服务于哪些业务目标
  • 多个报表间:报表间的关系

4.数据产品 

  • 指标监控
  • 上卷下钻
  • 自助提取
  • 异常告警

 

二、应用

指标异动分析,漏斗转化分析,用户画像洞察

 

2021/8/4

数据如何赋能产品—Magic Number (qq.com)

问题: 如何通过数据帮助产品发现影响留存的关键行为

目标: 找出影响留存的关键行为, 度量影响大小, 并判断是否有因果关系

分析思路:

1.关键行为提取 -> 2.行为 & 留存的相关性 -> 3.因果关系 -> 4.行为magic number

具体地:

  1. 通过用户旅程定性分析, 列举与留存可能高度相关的行为, 然后用sql提取数据
  2. 计算各行为与留存的相关系数
  3. 相关关系不能推出因果关系. 这里引入Granger causality test进行推断
  4. 若已经判断某行为是留存的原因, 例如一周刷抖音的时间是下一周是否会留存的原因, 那么接下来还需要去发现刷多长时间才是留存的magic number. 

换言之, 即我们需找到与目标行为是因果关系的关键行为, 并且给出促成因果关系成立的"阈值"(magic number)

 

案例: 某直播app的留存分析.

1. 与留存相关的行为主要有: 登录行为, 观看行为, 互动(弹幕)行为, 付费行为

2. 计算各行为与留存的相关性, 依据相关系数大小排序选出前n个行为, 例如:30天内的:登录天数、观看品类个数、观看主播数、日均观看时长

3. 格兰杰因果关系检验两个行为之间是否有因果关系

检验原理:两个变量X、Y之间的格兰杰因果关系定义为:
若在包含了变量X、Y的过去信息的条件下,对变量Y的预测效果要优于只单独由Y的过去信息对Y进行的预测效果,
即变量X有助于解释变量Y的将来变化,则认为变量X是引致变量Y的格兰杰原因

原假设: X 和 Y 不存在因果关系.

检验方法:给定显著性水平为0.05时,当经过格兰杰因果检验后计算出来的 p 值大于0.05 则接受原假设, 否则拒绝原假设
代码实现:python的statmodels包提供了该检验函数:
from statsmodels.tsa.stattools import grangercausalitytests

4. 发现了影响留存的关键原因之后, 可以通过行为指标-留存率的可视化曲线, 判断曲线趋势变化的阈值, 从而得到magic number

 

 

2021/8/2

AARRR指标体系

Acquisition 拉新:

  • 浏览量(渠道曝光量)、点击量、下载量(安装次数)
  • 新增用户数(新增注册用户)、新客留存率
  • 获客成本:CPM、CPC、CPA

Activation 活跃

  • DAU:当日活跃用户数
  • MAU:当月至少活跃一次的用户数
  • WAU:当周至少活跃一次的用户数

注意:我们知道用户生命周期可分为:引入期,成长期,成熟期,沉默期,流失期。

依此可以将活跃用户细分成: 新增、持续活跃、沉默复活、流失复活用户

 

——————————————————————————————

补充基本概念

离开业务的数据毫无价值。无论哪种互联网细分行业的业务都是基于解决“用户在某种场景下,产生的某种需求”。梳理有哪些业务数据,也就是要回答三个问题:谁?做了什么?结果怎样?于是我们可以将数据分为三大类:

  1. 用户数据(谁)
  2. 行为数据(做了什么)
  3. 业务数据(结果怎么样)

用户数据主要有:DAU,MAU,新增用户,留存率。

用户:
(1)认人
即用户数(user)=访问过服务的ID数
(2)认设备
即用户数=访问过服务的设备数
ios采用IDFV,安卓可基于多种ID拼接,有IMEI、Android ID、WLAN MAC、蓝牙MAC等
活跃:
(1)基于第三方数据平台
今天上报过事件(特指用户进行了主动操作的行为)->这个用户就活跃的
(2)基于公司自己的数据平台
用户执行了关键事件->这个用户是活跃的

新增用户:
不同的节点事件都可以作为一次新增,包括:点击渠道链接进入页面、下载、安装启动、激活。
按不同的事件进行新增活跃用户的计数,的对渠道方、应用开发方来说各有优缺点,有不同的适用场景。
留存:
如何计算新增用户七日留存?
这里给出三个算法:
算法一(又称七日日留存):(第七天留存用户数/第一天新增用户数)*100%
算法二(又称七日内留存):(第二天~第七天去重后的留存用户数/第一天新增用户数)*100%
算法三(消除周几影响):(第八天留存用户数/第一天新增用户数)*100%
注意:根据不同场景和要求适用不同的算法 
source:数据扫盲(1):我们常说的DAU、MAU是啥? | 人人都是产品经理 (woshipm.com)
数据扫盲(2):新增用户与留存到底是啥? | 人人都是产品经理 (woshipm.com)

 ——————————————————————————————

Retention 留存

  • 留存率:七日日留存、七日内留存
  • 流失率:统计周期内登陆的用户中,下一个周期未登陆的用户占比 
  • 用户生命周期
LT = 当日留存率 + 次日留存率 + ... + n日留存率

 

Revenue 转化

  • 社区类:培养一个能产生内容的活跃用户社区
    • 内容生成者
      • 内容生成用户总量
      • 内容生成比例 = 内容生成用户/用户总量 (-> 体现产品的内容生成健康度)
    • 内容互动者
      • 内容互动用户总量
      • 内容互动比例 = 内容互动用户总量/用户总量 (-> 体现产品的用户参与度)
  • 交易类 核心在于成交
    • GMV、成交额、销售收入(扣除退款)
    • 付费用户数、付费率
    • ARPU(Average Revenue Per User)、ARPPU(Average Revenue Per Paying User)
    • 复购率:复购率 = 周期内消费两次及以上的用户/用户总量
  • 企业型
    • 体验用户数、付费用户数
    • 付费率 = 付费用户数/体验用户数
    • 追加销售数、追加销售率 = 追加销售数/总付费用户数
    • ARPU、ARPPU
    • 客户终身价值

 

Refer 传播

  • 病毒k因子
    • 邀请率 = 发出的邀请数 / 现有用户数
    • 转化率 = 新注册数 / 邀请数  (转化率是指被感染用户(接到邀请的用户)转化成新用户的比例)
    • k = 邀请率 * 转化率 (= 新注册数/现有用户数) (-> 当k>1时,形成自传播)
  • 病毒传播周期
    • 是指从用户发出邀请,到新用户完成转化(如点击阅读、注册、消费的行为)所花费的时间。
    • 缩短周期的措施: 首先尽可能减少用户的操作成本; 其次可以增加用户的紧迫感
  • 净推荐值 = 推荐者数/总样本数 - 贬损者数/总样本数

 

产品日活DAU下降分析

source: https://zhuanlan.zhihu.com/p/116017580

  • 第一步: 确认数据真实性

确定是否是数据报表统计或者数据源头的问题

  • 第二步: 分维度确定异常原因

常见维度: 新老用户, 登陆平台, 版本, 入口, 登陆渠道, 区域, 时间(假期,日夜,产品周期性)

并计算影响系数:每一项数据都要和以往正常值做对比,算出影响系数。

影响系数 = (今日量-昨日量)/(今日总量-昨日总量)
or
影响系数 = 某维度下变化量/总变化量

例如: 老用户影响系数=(77.89-78)/(78.8-79.5)=0.16; 新用户影响系数=(0.98-1.5)/(78.8-79.5)=0.84

影响系数越大,说明此处就是主要的下降点

  • 第三步:异常范围定位后,进一步做假设

假设维度:

产品侧:功能, 策略方面

技术侧:系统性能, 加载速度, 关键行为路径上是否出现重大bug

运营侧:运营策略, push效果, 拉新渠道, 投放推广, 近期活动

 

1.2 选好数据指标的通用方法论

三部曲

1.从业务的最终目的出发梳理业务模块

拆解:多问几个how

目的:我要卖货

手段:通过图文来买货

支撑手段的手段:通过社区创作的优美的图文来卖货

2.判断业务模块所属类型

3. ?

 

电商类app指标体系

KPI模块: 收入等

用户模块: 支付/新消用户数, ARPU, 注册用户数, 复购率

流量模块: PV, UV, 转化率=支付人数/访问UV

商品模块: 销售额, SKU数, SPU数

仓配模块: 妥投运单量, 揽收及时率, 出库量

供应链模块: SKU缺货率, 库存周转率

posted @ 2021-07-30 16:39  Raylan  阅读(459)  评论(0)    收藏  举报