摘要: 一、集群规模确定 CDH体系结构 从数据量、计算性能要求、可靠稳定性、容错性等方面考虑。 数据量 现有数据量(如现有历史数据)和增量数据(日增、月增数据,一般需要考虑满足1-2年的容量,后续再扩容); 数据的副本数(Hadoop默认3副本,乘3倍); 数据清洗、融合加工处理、共享等过程产生的,中间表 阅读全文
posted @ 2022-04-03 19:14 思凡念真 阅读(1328) 评论(0) 推荐(0)