摘要:
数据聚合 聚合(aggregations)可以让我们极其方便的实现对数据的统计、分析、运算。例如: 什么品牌的手机最受欢迎? 这些手机的平均价格、最高价格、最低价格? 这些手机每月的销售情况如何? 实现这些统计功能的比数据库的sql要方便的多,而且查询速度非常快,可以实现近实时搜索效果。 聚合的种类 阅读全文
posted @ 2024-01-14 17:02
阿飞藏泪
阅读(82)
评论(0)
推荐(0)
摘要:
阅读全文
posted @ 2024-01-14 16:44
阿飞藏泪
阅读(6)
评论(0)
推荐(0)
摘要:
阅读全文
posted @ 2024-01-14 16:43
阿飞藏泪
阅读(6)
评论(0)
推荐(0)
摘要:
阅读全文
posted @ 2024-01-14 16:42
阿飞藏泪
阅读(5)
评论(0)
推荐(0)
摘要:
算子是什么: 算子:分布式集合对象上的API称之为算子。 算子分类: RDD的算子分为2类: Transformation:转换算子 Action:动作(行动)算子 阅读全文
posted @ 2024-01-14 15:10
阿飞藏泪
阅读(21)
评论(0)
推荐(0)
摘要:
RDD的创建主要有2种方式: • 通过并行化集合创建 ( 本地对象 转 分布式RDD ) • 读取外部数据源 ( 读取文件 ) 阅读全文
posted @ 2024-01-14 15:02
阿飞藏泪
阅读(21)
评论(0)
推荐(0)

浙公网安备 33010602011771号