1.
2.
HDFS:Hadoop分布式文件系统.
HBase:用于对打量数据进行快速读取/写入.
MapReduc:是Hadoop的主要执行框架.
Hive:用于执行对存储在Hadoop中数据的查询.
Fulme:是一个分布式的、具有可靠性和高可用性的服务。
Zookeeper:是Hadoop的分布式协调服务。
Pig:是对MapReduce编程复杂性的抽象。
Sqoop:是一个连通性工具。
3.
下载链接:http://www.apache.org/dyn/closer.cgi/hadoop/common/
安装步骤:https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html#Download
先决条件:
支持平台
支持GNU / Linux作为开发和生产平台。Hadoop在具有2000个节点的GNU / Linux集群上得到了证明。
Windows也是受支持的平台,但是以下步骤仅适用于Linux。要在Windows上设置Hadoop。
必备软件
Linux所需的软件包括:
- 必须安装Java™。HadoopJavaVersions中描述了推荐的Java版本。
- 如果要使用可选的启动和停止脚本,则必须安装ssh并且必须运行sshd才能使用管理远程Hadoop守护程序的Hadoop脚本。另外,建议也安装pdsh以便更好地进行ssh资源管理。
前期准备好之后,详细安装步骤:https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html#Download
4.
华为FusionInsight HD发行版紧随开源社区的最新技术,快速集成最新组件,并在可靠性、安全性、管理性等方面做企业级的增强,持续改进,持续保持技术领先。FusionInsight HD基于开源组件实现功能增强,保持100%的开放性,不使用私有架构和组件。支持安全协议Kerberos,FusionInsight HD使用LDAP作为帐户管理系统,并通过Kerberos对帐户信息进行安全认证。Hive、HBase可以对表、字段加密,集群内部用户信息禁止明文存储。加密算法插件化,可进行扩充,亦可自行开发。非敏感数据可不加密,不影响性能(加密约有5%性能开销)。上层业务只需指定敏感数据(Hive表级、HBase列族级加密),加解密过程业务完全不感知。所有管理节点组件均实现HA(High Availability)业界第一个实现所有组件HA的产品,确保数据的可靠性、一致性。NameNode、Hive Server、HMaster、Resources Manager等管理节点均实现HA。
浙公网安备 33010602011771号