摘要:
Hive 背景 引入原因 对存在HDFS上的文件或HBase中的表进行查询时,是要手工写一推MapReduce代码 对于统计任务,只能由懂MapReduce的程序员才能搞定 耗时耗力,更多精力没有有效的释放出来 Hive基于一个统一的查询分析层,通过SQL语句的方式对HDFS上的数据进行查询、统计和
阅读全文
posted @ 2019-03-03 15:44
0x153_小波
阅读(118)
推荐(0)
摘要:
Linux常用命令 一 、须知 起始符:[root@localhost~] 目录或文件的详细信息说明 -rw-r--r--. 1 root devmind 24772 1月 14 18:18 anaconda-ks.cfg linux中的通配符 命令基本格式:命令 [选项] [参数] 个别命令使用不
阅读全文
posted @ 2019-03-03 15:36
0x153_小波
阅读(319)
推荐(0)
摘要:
本地操作 启动thrift服务:./bin/hbase-daemon.sh start thrift hbase模块产生: 下载thrfit源码包:thrift-0.8.0.tar.gz 解压安装 ./configure make make install 在thrift-0.8.0目录中,lib/
阅读全文
posted @ 2019-03-03 15:34
0x153_小波
阅读(358)
推荐(0)
摘要:
创建表 描述表信息 增加列蔟 删除列蔟 删除表 写数据 读数据 查看行数 清空词表
阅读全文
posted @ 2019-03-03 15:33
0x153_小波
阅读(122)
推荐(0)
摘要:
Hbase 定义 HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,实现 的编程语言为 Java。 是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,因此可以容错地存 储海量稀疏的数据 HBase是一个开源的非关系型分布式数据
阅读全文
posted @ 2019-03-03 15:32
0x153_小波
阅读(156)
推荐(0)
摘要:
解析es的分布式架构 ElasticSearch是一个分布式系统,隐藏了复杂的处理机制 分片机制:我们不用关系数据是按照什么机制分片的、最后放入到哪个分片中 分片的副本:集群发现机制(cluster discovery):比如当前我们启动了一个es进程,当启动了第二个es进程时,这个进程作为一个no
阅读全文
posted @ 2019-03-03 15:18
0x153_小波
阅读(111)
推荐(0)
摘要:
复合查询 将多个基本查询组合成单一查询的查询 GET /lib2/user/_search{ "query":{ "bool":{ "must":{ "match":{"interests":"唱歌"} }, "must_not":{ "match":{"interests":"旅游"} }, "s
阅读全文
posted @ 2019-03-03 15:16
0x153_小波
阅读(93)
推荐(0)
摘要:
聚合查询 sum # 聚合查询GET /lib3/user/_search{ "size": 0, # "aggs": { "price_of_sum": { # 取名 "sum": { "field": "price" } } }} min GET /lib3/user/_search{ "siz
阅读全文
posted @ 2019-03-03 15:15
0x153_小波
阅读(1176)
推荐(0)
摘要:
Filter查询 filter是不计算相关性的,同时可以cache,因此,filter速度要块于query 数据准备 POST /lib3/user/_bulk{"index":{"_id":1}}{"price":40,"itemID":"ID100123"}{"index":{"_id":2}}
阅读全文
posted @ 2019-03-03 15:14
0x153_小波
阅读(240)
推荐(0)
摘要:
数据准备 term查询和terms查询 term query回去倒排索引中寻找确切的term,它并不知道分词器的存在。这种查询适合keyword、numeric、date。 term:查询某个字段含有某个关键词的文档 GET /lib1/user/_search{ "query": { "term"
阅读全文
posted @ 2019-03-03 15:12
0x153_小波
阅读(499)
推荐(0)