随笔分类 -  数据处理

摘要:一、Stream:被处理的数据 二、Spout:数据源 消息源Spout是Storm的Topology中的消息生产者(Tuple的创造者)。如图几个Spout接口都继承自IComponent Spout从外部获取数据后,向Topology发出的Tuple可以是可靠的,也可以是不可靠的 可靠的:一个可 阅读全文
posted @ 2018-09-17 14:18 动物园里的一只程序猿 阅读(1480) 评论(0) 推荐(0)
摘要:hbase存储:HBase存储数据其底层使用的是HDFS来作为存储介质,HBase的每一张表对应的HDFS目录上的一个文件夹,文件夹名以HBase表进行命名(如果没有使用命名空间,则默认在default目录下),在表文件夹下存放在若干个Region命名的文件夹,Region文件夹中的每个列簇也是用文 阅读全文
posted @ 2018-08-22 15:38 动物园里的一只程序猿 阅读(379) 评论(0) 推荐(0)