摘要: 1. 基于虚拟机的虚拟化和基于容器的虚拟化 非正式的说,虚拟化是通过软件手段对计算机硬件资源镜像整合管理和再分配的一种技术。最常用的就是基于虚拟机(Hypervisor-based)的虚拟化,经过40年的发展,基于虚拟机的虚拟化技术已经比较成熟,它通过一个软件层的封装,提供和物理硬件相同的输入输出表 阅读全文
posted @ 2017-04-19 20:49 DarrenChan陈驰 阅读(888) 评论(0) 推荐(0)
摘要: 在做Hadoop数据挖掘项目的时候,我们第一步是源数据的获取,即把相应的数据放置到HDFS中,以便Hadoop进行计算,手动将文件上传到HDFS中,未免太费时费力,所以我们可以采取像Flume一样的框架,或者采用Shell脚本进行文件的上传。下面主要提供Shell脚本的大致写法,仅供参考,可以根据不 阅读全文
posted @ 2017-04-19 08:16 DarrenChan陈驰 阅读(6831) 评论(0) 推荐(0)