上一页 1 2 3 4 5 6 ··· 8 下一页
摘要: 相关博文:大数据系列之并行计算引擎Spark部署及应用 Spark: Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。 Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spar 阅读全文
posted @ 2017-04-19 22:59 孟凡柱的专栏 阅读(7011) 评论(0) 推荐(0) 编辑
摘要: 之前介绍过关于FastDFS单机部署,详见博文:FastDFS+Nginx(单点部署)事例 下面来玩下FastDFS集群部署,实现高可用(HA) 服务器规划: 跟踪服务器1【主机】(Tracker Server):192.100.139.121 跟踪服务器2【备机】(Tracker Server): 阅读全文
posted @ 2017-04-18 23:45 孟凡柱的专栏 阅读(30144) 评论(3) 推荐(1) 编辑
摘要: 关于presto部署及详细介绍请参考官方链接 http://prestodb-china.com PRESTO是什么? Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。 Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互 阅读全文
posted @ 2017-04-16 19:11 孟凡柱的专栏 阅读(5297) 评论(0) 推荐(0) 编辑
摘要: Hive系列博文,持续更新~~~ 大数据系列之数据仓库Hive原理 大数据系列之数据仓库Hive安装 大数据系列之数据仓库Hive中分区Partition如何使用 大数据系列之数据仓库Hive命令使用及JDBC连接 Hive的工作原理简单来说就是一个查询引擎 先来一张Hive的架构图: Hive的工 阅读全文
posted @ 2017-04-09 16:23 孟凡柱的专栏 阅读(10227) 评论(0) 推荐(0) 编辑
摘要: Hive系列博文,持续更新~~~ 大数据系列之数据仓库Hive原理 大数据系列之数据仓库Hive安装 大数据系列之数据仓库Hive中分区Partition如何使用 大数据系列之数据仓库Hive命令使用及JDBC连接 Hive主要分为以下几个部分 ⽤户接口1.包括CLI,JDBC/ODBC,WebUI 阅读全文
posted @ 2017-04-09 10:45 孟凡柱的专栏 阅读(1415) 评论(0) 推荐(0) 编辑
摘要: Hive系列博文,持续更新~~~ 大数据系列之数据仓库Hive原理 大数据系列之数据仓库Hive安装 大数据系列之数据仓库Hive中分区Partition如何使用 大数据系列之数据仓库Hive命令使用及JDBC连接 本文介绍Hive的使用原理及命令行、Java JDBC对于Hive的使用。 在Had 阅读全文
posted @ 2017-04-09 10:39 孟凡柱的专栏 阅读(7336) 评论(0) 推荐(0) 编辑
摘要: Hive系列博文,持续更新~~~ 大数据系列之数据仓库Hive原理 大数据系列之数据仓库Hive安装 大数据系列之数据仓库Hive中分区Partition如何使用 大数据系列之数据仓库Hive命令使用及JDBC连接 一、背景 1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没 阅读全文
posted @ 2017-04-09 10:36 孟凡柱的专栏 阅读(6008) 评论(0) 推荐(0) 编辑
摘要: 清明刚过,该来学习点新的知识点了。 上次说到关于MapReduce对于文本中词频的统计使用WordCount。如果还有同学不熟悉的可以参考博文大数据系列之分布式计算批处理引擎MapReduce实践。 博文发表后很多同学私下反映对于MapReduce的处理原理没有了解到。在这篇博文中楼主与大家交流下M 阅读全文
posted @ 2017-04-07 18:02 孟凡柱的专栏 阅读(982) 评论(0) 推荐(0) 编辑
摘要: Java中的final关键字非常重要,它可以应用于类、方法以及变量。这篇文章中我将带你看看什么是final关键字?将变量,方法和类声明为final代表了什么?使用final的好处是什么?最后也有一些使用final关键字的实例。final经常和static一起使用来声明常量,你也会看到final是如何 阅读全文
posted @ 2017-03-21 22:19 孟凡柱的专栏 阅读(197) 评论(0) 推荐(0) 编辑
摘要: CAP原则又称CAP定理,指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可得兼。 CAP原则是NOSQL数据库的基石。Consistency(一致性)。 Availability(可用性 阅读全文
posted @ 2017-03-20 22:00 孟凡柱的专栏 阅读(1149) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 8 下一页