码迷,mamicode.com
首页 > 其他好文 > 详细

Hadoop学习笔记

时间:2018-02-24 16:51:20      阅读:161      评论:0      收藏:0      [点我收藏+]

标签:学习笔记   log   读取   name   hadoop   文件拷贝   判断   ado   gpo   

1.Client上传文件流程
  a.Client先和namenode通信,判断上传文件的目录是否存在
  b.再将操作日志记录到edits文件中
  c.文件拷贝
  d.上传完毕后,同步到namenode的元数据

2.mapreduce读取半行数据如何处理:
  a.后一分片的半行数据给前一分片
  b.偏移量不为零,则丢弃
  c.如果没有读到\r\n结尾符,会继续往后读

Hadoop学习笔记

标签:学习笔记   log   读取   name   hadoop   文件拷贝   判断   ado   gpo   

原文地址:https://www.cnblogs.com/yezl/p/8466132.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!