Fork me on GitHub
摘要: 一.来源 此项目来源《Data Algorithms Recipes for Scaling Up with Hadoop and Spark》第11章,本程序利用spark3.0以及java8进行改写, 改写的有: 1.利用spark3.0与java8 2.直接利用spark生成最终的状态转移矩阵 阅读全文
posted @ 2020-11-22 10:39 石头木 阅读(373) 评论(0) 推荐(0)
摘要: 一.目的 基于基站定位数据的商圈分析移动通信网络会记录用户手机的相关信息,比如手机所处的基站区域编号,所处基站的时间等。根据这些数据可以进行商圈划分,目的是为了研究潜在的顾客的分布以制定适宜的商业对策。如:可划分商业区、住宅区以及工作区 二.数据 数据来源【Python数据分析与挖掘实战(第14章基 阅读全文
posted @ 2020-11-22 10:25 石头木 阅读(815) 评论(0) 推荐(0)
摘要: 一.数据 这是一个Udacity纳米学位项目(数据科学的顶点)。这个项目使用来自Sparkify的用户事件数据来建立一个模型来预测用户的流失。Sparkify是一个类似于Spotify或Pandora的数字化音乐服务(类似于网易云音乐和QQ音乐的音乐平台)。使用Spark分析探索某数字音乐服务平台S 阅读全文
posted @ 2020-11-22 10:13 石头木 阅读(458) 评论(0) 推荐(0)