欢迎来到菜鸟的博客

导航

2018年8月9日 #

Hive学习笔记记录

摘要: 典型数据来源: 文件管理服务: FTP文件服务:采用c/s模式,用户可以通过不同的客户端实现文件的上传与下载。 NFS文件服务:借助于TCP/IP协议实现网络文件共享 Samba文件服务:是一种在局域网上实现文件的资源共享。 数据质量检测评估: 1)完整性(数据信息是否存在缺失的情况) 2)一致性( 阅读全文

posted @ 2018-08-09 20:14 张的学习笔记 阅读(113) 评论(0) 推荐(0)

Hadoop学习笔记记录

摘要: NameNode的介绍: NameNode是HDFS的核心,也称为master,它仅存储元数据(文件系统中所有文件的目录树) NameNode不存储实际的数据或数据集,数据本身存储在DateNodes中 NameNode知道HDFS中任何给定文件的块列表及其位置信息,当NameNode 关闭时,Hd 阅读全文

posted @ 2018-08-09 09:42 张的学习笔记 阅读(111) 评论(0) 推荐(0)