摘要:一、标签计算 数据 处理过程分析 (1)第一步:筛选出extInfoList不为空的记录,并去除values中的标签值 获取到的记录形式 (2)第二步:分离标签 获取到的记录形式 (3)第三步:统计标签 获取到的记录形式 JSON解析代码 Spark统计代码 二、用户画像 用户画像介绍 根据用户的信 阅读全文
posted @ 2019-11-19 10:33 CoffeJoy 阅读 (52) 评论 (0) 编辑
摘要:一、Spark介绍 Apache Spark is a fast and general purpose cluster computing system. It provides high level APIs in Java, Scala, Python and R, and an optimi 阅读全文
posted @ 2019-11-19 10:26 CoffeJoy 阅读 (256) 评论 (0) 编辑