随笔分类 -  bigdata

摘要:Hbase是一个Hadoop Database,是分布式、弹性、大数据存储引擎 Hbase的目标是托管大表-数十亿行数百万列。 1 安装 Hbase版本和java版本以及Hadoop版本之间存在依赖关系。可以在这里查看https://hbase.apache.org/book.html#java 1 阅读全文
posted @ 2023-10-29 12:12 zhenjingcool 阅读(222) 评论(0) 推荐(0)
摘要:Hadoop是一个分布式计算框架,用于存储和处理大规模数据集。 首先搞清楚为什么需要使用Hadoop Hadoop进行数据处理可以充分利用分布式计算和存储的优势,适用于大规模数据的批处理和分布式计算场景。 裸机上进行数据处理则更适合小规模数据或需要实时处理的场景。 在裸机上进行数据处理和使用Hado 阅读全文
posted @ 2023-10-20 17:09 zhenjingcool 阅读(178) 评论(0) 推荐(0)