随笔分类 -  hbase

摘要:hbase写数据流程 ⾸先从 zk找到meta表的region位置,然后读取meta表中的数据,meta表中存储了用户表的region信息 根据namespace、表名和rowkey信息。找到写入数据对应的 region信息 找到这个region对应的regionServer,然后发送请求 把数据分 阅读全文
posted @ 2021-01-17 09:01 凯尔哥 阅读(495) 评论(0) 推荐(0)
摘要:客户端发送查询命令 scan 'user', {COLUMNS => 'base_info', STARTROW => 'rk1', ENDROW => 'rk3'} 寻址过程 1. 客户端请求zk,获取meta表所在位置 2. zk返回节点位置(假设在hadoop01节点) 3. 客户端访问had 阅读全文
posted @ 2021-01-17 08:15 凯尔哥 阅读(497) 评论(0) 推荐(0)
摘要:背景 有一个超级大的文件,里面存放的全都是url,样本数据(url.txt)如下: www.baidu.com www.jd.com www.taobao.com ...... 需求 现在需要实时地判断出某个url是否包含在这个文件中,如何实现? 思路分析 1. 要实现查询速度快,肯定是要将所有的u 阅读全文
posted @ 2021-01-16 15:44 凯尔哥 阅读(177) 评论(0) 推荐(0)