摘要: 1、用Pyspark自主实现词频统计过程。 2. 并比较不同计算框架下编程的优缺点、适用的场景。 –Python –MapReduce –Hive –Spark Mapreduce,它最本质的两个过程就是Map和Reduce,Map的应用在于我们需要数据一对一的元素的映射转换,比如说进行截取,进行过 阅读全文
posted @ 2021-04-23 11:43 Frank05 阅读(81) 评论(0) 推荐(0) 编辑