从美团笔试题看广告数据分析

一、美团笔试题目

广告是互联网企业重要的变现模式,在美团的广告业务中,商家会和美团的销售签订不同类型的广告合同(比如,按点击收费的广告cpc、按曝光收费的广告cpm、按时长收费的广告cpt)。美团会为商家创建相关的广告内容素材创意(比如,门店图片、活动图片、促销文字等),并通过美团的广告引擎,根据用户访问的行为特征,基于算法策略将商家的广告内容投放到美团的app或者外部合作伙伴(比如如:腾讯,头条)的app不同的展示位置上。普通用户访问这些广告后,会对商家产生兴趣,可能产生购买转换行为,美团会和商家做广告的计费结算,同时为商户提供用户的广告效果信息(比如:广告带来的门店访问量、订单数等)。

1、 如果让你对这个业务进行抽象,你会抽象出哪些数据分析主题,并说出你这样分的原因;

2、 请你根据问题1抽象的主题,进行主题模型设计,并说明设计的模型内容,以及模型之间的关系。

二、广告数据分析

首先要明确分析目的,美团作为广告投放平台方,流量、用户数据是其最大的资源。而作为平台方,数据分析的最终目的在于利用本身资源获得最大的收益。广告数据分析就是对自身资源进行分析,分析各资源位的曝光、转化以及经济收益,以吸引更多的广告主、获得更高的收益。当前信息流广告主要是以RTB(公开竞价)的方式售卖。

因此,如何优化广告的转化是广告投放的重点。互联网广告的转化路径一般为:

广告曝光-->用户点击-->进入落地页-->产品浏览、选择-->提交订单,完成支付

1. 广告投放的基本数据指标

过程指标

  1. 曝光量: 即广告展示在用户端的数量;
  2. 点击率(CTR) :广告点击与展现的比率成为;
  3. 到达率: 用户点击之后到达落地页(landing page)称之为到达,成功到达落地页和点击次数的比例;
  4. 转化率(CVR):用户最终完成下单称之为转化,转化次数与到达次数的比例称为转化率(CVR, Convesion Rate)。在实际场景中,了能要经历多次转化,比如新用户注册等,是一个转化漏斗。

常用指标

  1. CPM (Cost Per Mile):千次展示结算。这种方式的收费与广告主的收益无关,展示是否能带来收益的风险由广告主承担。这种结算凡事适合选产品牌形象,提升中长期购买率和利润空间的广告。
  2. CPC(Cost Per Click):按照点击结算。其中,广告平台方,也就是题目中的美团,根据大量用户行为数据来估计点击率,而每次点击的价值,则由广告主进行估计,然后出价。
  3. CPT (Cost Per Time):按照展示时长结算。

然而以上收入指标,如CPC的点击量是无法提前知道的,只能事先估计,因此产生了更重要的指标:

  1. eCPM(estimated/expected Cost Per Mile):

    eCPM = CTR * V * 1000

    其中V代表点击价值,即单次点击可为广告主带来的收益。

    V = 到达率 * 转化率 * 客单价

  2. 实际收费:实际上最终的广告收费并不是按照竞价中的最高出价(获得曝光的广告主的出价),而是采用第二高价机制。这是由于如果按照第一高价原则,那么竞价者通常最多给出自己承受上限的价格;而如果采用第二高价机制,那么竞价竞价者很可能会出到自己承受上限的价格,因为最终价格是自己出价的下一价格。这样的机制通常来说平台收益会更高。这种定价机制本质上来自于博弈论中的纳什均衡理论。具体来说

    \[CPC = \frac{第二高价出价*第二高价预估CTR}{第一高价者的预估CTR} + 0.01 \]

  3. ROI :投资回报率

2. 模型

影响广告投放的因素很多,如广告定向人群、广告创意、广告文案、广告位置等等。在前文的竞价广告的竞价原理里也提到,通过提高预估CTR,可以提升ROI。因此,在广告投放中需要找到最优的投放组合,提升CTR或者转化率,从而提升ROI。找寻最优的投放组合,目前用到最多的方法是AB测试,以及用朴素贝叶斯算法预估转化率比较高的人群定向投放组合。

本节通过一个模拟场景来解释各模型的使用方法。假设某广告主在美团投放广告有如下统计结果:

广告定向 曝光量 点击量 到达量 转化量
1000 100 90 25
800 60 58 15
Android 1200 70 59 16
iOS 600 90 85 24

1. 漏斗模型

漏斗模型是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况,是一种重要的分析模型,常见的漏斗模型包括AIDMA模型AISAS模型以及AARRR模型。漏斗分析模型已经广泛应用于网站和APP用户行为分析的流量监控、CRM系统、SEO优化、产品营销和销售等日常数据运营与数据分析的工作中。在广告数据分析中,我们可以根据漏斗模型来分析广告转化路径中每个环节的转化效果,从而找到瓶颈环节。如上述模拟案例数据可以发现:

转化路径 数量 本层转化率 累计转化率
曝光 1800 1 1
点击 160 8.89% 8.89%
到达 148 92.5% 8.22%
转化 40 27.03% 2.22%

从上表可以看到,从点击到到达的转化率最高,说明落地页的响应能力较好;而点击率很低,是整个转化路径中的瓶颈(实际上也不一定最低就是瓶颈,因为点击率本来就很低,要结合各路径更精确分析),应当优化广告展示,吸引用户点击。

2. A/B测试

A/B Test 一般有两个目的,一个是判断哪个更好;另一个是计算新功能或者新设计带来的收益。在广告投放优化中,一般用来判断不同的投放对象组之间的差异。

  • 构建原假设和备择假设:

    H0 : 对应组间没有差异,即 p1 = p2

    H1 : 对应组间有显著差异,即 p1 != p2

  • 构造检验统计量:

    \[z = \frac{p_1-p_2}{\sqrt{\frac{p_1*(1-p_1)}{N_1}+\frac{p_2*(1-p_2)}{N_2}}} \]

  • 显著性检验,设显著性水平为0.5,则双边检验的置信区间为-1.96到1.96

以上述模拟场景数据,计算可得

广告定向组 转化率z值
性别组:男—女 0.89
操作系统组:Android—iOS 3.12

从上表可以看到,性别男和女的转化率z值在-1.96~1.96之间,则接受原假设,即男女组之间转化率没有显著差异。同时,操作系统之间有显著差异。

3. 朴素贝叶斯

朴素贝叶斯是基于贝叶斯公式的一种算法,可以通过先验概率来计算后验概率。由于他假设特征之间是相互独立的,所以称之为朴素贝叶斯。在现实生活中,即使假设不成立,仍能取得较好的表现。贝叶斯公式:

\[P(A|B) = \frac{P(A)*P(B|A)}{P(B)} \]

当特征有多个时:

\[P(A|B) = \frac{P(A)*\prod_{i=0}P(B^i|A)}{\sum_{k}(P(A^i)*\prod_{i=0}P(B^i|A))} \]

通过朴素贝叶斯算法,以及历史转化数据的用户画像分布,可以计算各个广告定向组合下的转化概率。

首先计算转化率的用户分布:

广告定向 转化=1 转化=0
0.625 0.554
0.375 0.446
Android 0.4 0.673
iOS 0.6 0.327

总体转化率为0.022。

之后基于朴素贝叶斯公式计算广告定向组合转化的概率:

广告定向组合 转化概率
男+Android 0.015
男+iOS 0.044
女+Android 0.011
女+iOS 0.033

从以上组合转化概率计算结果来看,男+iOS的组合转化概率最高,其次是女+iOS的组合。因此应当将广告优先投放给使用苹果手机的男性。

参考文献:计算广告 互联网商业变现的市场与技术

posted @ 2021-03-10 22:34  Cetusの  阅读(922)  评论(0编辑  收藏  举报