摘要: 1Hadoop的起源 2003年、2004年谷歌发表的两篇论文为该问题提供了可行的解决方案。——分布式文件系统(GFS),可用于处理海量网页的存储——分布式计算框架MAPREDUCE,可用于处理海量网页的索引计算问题。Nutch的开发人员完成了相应的开源实现HDFS和MAPREDUCE,并从Nutc 阅读全文
posted @ 2021-11-19 09:20 wssds 阅读(48) 评论(0) 推荐(0)