摘要:
Scala是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。Scala运行于Java平台(Java虚拟机)之上,并兼容现有的Java程序。因此,要安装Scala环境之前,首先需要安装Java的JDK。学习Scala编程语言,将为后续学习Spark和Flink奠定基础。 阅读全文
posted @ 2025-12-16 08:48
赵渝强老师
阅读(1)
评论(0)
推荐(0)
摘要:
HBase的逻辑存储结构主要包括:命名空间(NameSpace)、表(Table)和列族(Column Family)。 点击这里查看视频讲解:【赵渝强老师】HBase的存储结构 下面分别进行介绍。 一、 命名空间(NameSpace) HBase的命名空间相当于Oracle和MySQL中的数据库 阅读全文
posted @ 2025-12-16 08:45
赵渝强老师
阅读(5)
评论(0)
推荐(0)
摘要:
基于开源的大数据技术,阿里云开发了自己的大数据计算服务,即:MaxCompute大数据计算服务。MaxCompute原名为ODPS(Open Data Processing Service),它是阿里云提供的数据仓库解决方案,并提供大数据量(百TB、PB、EB)的结构化数据的存储和计算服务。由于Ma 阅读全文
posted @ 2025-12-16 08:41
赵渝强老师
阅读(14)
评论(0)
推荐(0)
摘要:
阿里云大数据计算服务(MaxCompute)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。 点击这里查看视频讲解:【赵渝强老师】阿里云大数据存 阅读全文
posted @ 2025-12-16 08:35
赵渝强老师
阅读(5)
评论(0)
推荐(0)
摘要:
阿里云提供的大数据计算服务MaxCompute(原名ODPS,Open Data Processing Service的简称)是一种快速、完全托管的EB级数据仓库解决方案,主要用于实时性要求不高的离线计算分布式处理场景。因此,大数据计算服务MaxCompute不能用于数据的实时处理场景中。MaxCo 阅读全文
posted @ 2025-12-16 08:32
赵渝强老师
阅读(14)
评论(0)
推荐(0)
摘要:
Sqoop是SQL To Hadoop的简称,它是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(Oracle、MySQL等)间进行数据的传递。通过使用Sqoop可以将一个关系型数据库中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。Sqoop是 阅读全文
posted @ 2025-12-16 08:28
赵渝强老师
阅读(9)
评论(0)
推荐(0)
摘要:
Hadoop HDFS的快照(Snapshot)是一个全部文件系统、或者某个目录在某一时刻的镜像。这里其实可以把HDFS的快照理解成是HDFS提供的一种备份机制。快照应用在以下场景中: 防止用户的错误操作 备份 试验/测试 灾难恢复 点击这里查看视频讲解:【赵渝强老师】Hadoop HDFS的快 阅读全文
posted @ 2025-12-16 08:21
赵渝强老师
阅读(7)
评论(0)
推荐(0)

浙公网安备 33010602011771号