推荐系统之必备要素:数据
数据可分为以下几个维度:
- 用户维度:分为显式、隐式
- 物料&表现数据维度
- 其他数据
-------------------------------------------------
数据经过以下过程逐步凑体现出业务利用价值:
S1-采集
采集的数据包括结构化和非结构化两种,是正确的业务建模、高效工程的基础。其中最重要的一部分是埋点数据,埋点的数据要经历ETL清洗、数据整合、报表呈现等过程才能进入下一步数据挖掘的步骤。
埋点数据指标的规划涉及到三个主要方面:指标定义、指标维度、更新周期。
埋点数据按照类型又会分为:
-
- 点击、收藏、加购、购买、浏览时长等等业务方面的行为数据。用户行为=商品/内容等信息载体(类目、年代、明星、etc)+显性操作(购买、关注、下载、etc)+隐形操作(时长、跳过、etc)
- Query
- icon
- 推荐/展示逻辑信息
采集的数据通过以下六个维度考察是否符合要求:
-
- 完整性
- 及时性:根据业务需求及特性来决定采集频率
- 规范性
- 一致性:相同名称的数据在不同场景下依然代表同样的含义。
- 准确性:定义准确,无歧义
- 关联性
S2-数据挖掘
在数据中发现业务的隐藏信息和规律
S3-决策
S4-数据驱动
方向1 确定分析目标,根据数据分布发现业务问题。
方向2 找到合适的指标,制定相应数据阀值,监控数据异常
方向3 评估数据渠道,通过对数据的二次加工和分析,比较渠道优劣,从而确定迭代方向
通过数据,亦可实现行为路径分析、单体用户行为跟踪、精细化用户分群等常见的运营需求。
浙公网安备 33010602011771号