2018年11月20日

sparkSQL简介

摘要: SparkSQL简介 一:什么是sparkSQL呢? SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用,实际上它也是一个API。Spark SQL中提供的接口将会提供给Spark更多关于结构化数据和计算的信息。 名词解释: 阅读全文

posted @ 2018-11-20 16:01 优品三悦 阅读(618) 评论(0) 推荐(1) 编辑

Impala简介

摘要: Impala简介 一:什么是Impala? Impala是用于处理存储在Hadoop集群中的大量数据的SQL查询引擎。它是一个用C ++和Java编写的开源软件。换句话说,Impala是性能最高的SQL引擎,它提供了访问存储在Hadoop分布式文件系统中的数据的最快方法。 二:Impala的特点是什 阅读全文

posted @ 2018-11-20 15:57 优品三悦 阅读(1099) 评论(0) 推荐(0) 编辑

导航