摘要: 1.用图与自己的话,简要描述Hadoop起源与发展阶段。Hadoop最早起源于lucene下的Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题——如何解决数十亿网页的存储和索引问题。 问题的可解决提供方案 阅读全文
posted @ 2021-10-31 20:26 孙桂文 阅读(57) 评论(0) 推荐(0)
摘要: 一、在Ubuntu系统中安装和配置Eclipse 二、利用hadoop 的java api,向HDFS写一个文件。 三、从HDFS读取一个文件的内容 阅读全文
posted @ 2021-10-31 20:24 孙桂文 阅读(30) 评论(0) 推荐(0)