Hadoop学习笔记

1.Client上传文件流程
  a.Client先和namenode通信,判断上传文件的目录是否存在
  b.再将操作日志记录到edits文件中
  c.文件拷贝
  d.上传完毕后,同步到namenode的元数据

2.mapreduce读取半行数据如何处理:
  a.后一分片的半行数据给前一分片
  b.偏移量不为零,则丢弃
  c.如果没有读到\r\n结尾符,会继续往后读

posted @ 2018-02-24 15:45  叶珍力  阅读(178)  评论(0编辑  收藏  举报