摘要:
Hadoop分支 Apache Cloudera Hortonworks 本文是采用Cloudera分支的hadoop。 下载cdh-5.3.6 版本 下载地址:http://archive.cloudera.com/cdh5/cdh/5/ 各组件版本一定保持一致。 cdh5.3.6-snappy- 阅读全文
摘要:
Sqoop http://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_introduction Flume http://flume.apache.org/documentation.html Oozie http://oozie.apache. 阅读全文
摘要:
关于委托和线程 无意间看到一个奇葩的解释,说委托的本质的就是多线程,这...... 委托本质就是一个函数的指针而已,和线程完全是不同的概念;如果非要扯上点关系,就是同步委托和异步委托。同步委托就是占用主线程同步执行,异步委托肯定是开启新的线程去执行委托指向的函数。多播委托其实也是一样的,无非就是绑定 阅读全文
摘要:
HiveServer2 https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Overview2 https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Client 阅读全文
摘要:
https://blog.csdn.net/zc474235918/article/details/50580639 https://blog.csdn.net/jiadajing267/article/details/54581262 阅读全文
摘要:
如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系? https://www.zhihu.com/question/27974418 HBase 和 Hive 的差别是什么,各自适用场景? https://www.zhihu.com/question/21677 阅读全文
摘要:
Hive表的创建和数据类型 https://cwiki.apache.org/confluence/display/Hive/Home 管理表和外部的区别 分区表创建及查询 分区表实际上就是对应一个HDFS文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录,把一个 阅读全文
摘要:
hive 常用的几种shell交互方式 查看hive命令帮助:bin/hive -help 不进入hive shell交互界面,直接执行: 把sql脚本写入文件,通过 bin/hive -f 加载并执行脚本文件;通过bin/hive -f /opt/datas/hivef.sql > /opt/da 阅读全文
摘要:
表的rowkey设计核心思想: 预分区创建的三种方式 tail -f 在命令列控制窗口中使用 tail -f,它将会以一定的时间实时追踪. 基于SQL语法查询HBase Phoenix实现用SQL查询HBase hbase二级索引 使用solr构建hbase二级索引: https://www.cnb 阅读全文