摘要:一、标签计算 数据 处理过程分析 (1)第一步:筛选出extInfoList不为空的记录,并去除values中的标签值 获取到的记录形式 (2)第二步:分离标签 获取到的记录形式 (3)第三步:统计标签 获取到的记录形式 JSON解析代码 Spark统计代码 二、用户画像 用户画像介绍 根据用户的信 阅读全文
posted @ 2019-11-19 10:33 清泉白石 阅读(670) 评论(0) 推荐(0) 编辑
摘要:一、Spark介绍 Apache Spark is a fast and general purpose cluster computing system. It provides high level APIs in Java, Scala, Python and R, and an optimi 阅读全文
posted @ 2019-11-19 10:26 清泉白石 阅读(994) 评论(0) 推荐(0) 编辑