摘要: Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台, YARN的重要概念 yarn并不清楚用户提交的程序的运行机制 yarn只提供运算资源的调度(用户程序向yarn申请资源,yarn就负责分配资源) yarn中的主管角色叫ResourceManager ya 阅读全文
posted @ 2021-10-20 20:14 cos晓风残月 阅读(143) 评论(0) 推荐(0)
摘要: 分布式文件系统: 统一管理分布在集群上的文件系统 设计思想 分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析; 在大数据系统中作用: 为各类分布式运算框架(如:mapreduce,spark,tez,……)提供数据存储服务 重点概念:文件切块, 阅读全文
posted @ 2021-10-20 20:01 cos晓风残月 阅读(266) 评论(0) 推荐(0)