欢迎来到菜鸟的博客

导航

2018年8月10日 #

zookeeper学习笔记记录

摘要: zookeeper的概述: ZooKeeper 本质上是一个分布式的小文件存储系统。提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理。从而用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理。诸如:统一命名服务、分布式配置管理 阅读全文

posted @ 2018-08-10 10:59 张的学习笔记 阅读(89) 评论(0) 推荐(0) 编辑

2018年8月9日 #

Hive学习笔记记录

摘要: 典型数据来源: 文件管理服务: FTP文件服务:采用c/s模式,用户可以通过不同的客户端实现文件的上传与下载。 NFS文件服务:借助于TCP/IP协议实现网络文件共享 Samba文件服务:是一种在局域网上实现文件的资源共享。 数据质量检测评估: 1)完整性(数据信息是否存在缺失的情况) 2)一致性( 阅读全文

posted @ 2018-08-09 20:14 张的学习笔记 阅读(101) 评论(0) 推荐(0) 编辑

Hadoop学习笔记记录

摘要: NameNode的介绍: NameNode是HDFS的核心,也称为master,它仅存储元数据(文件系统中所有文件的目录树) NameNode不存储实际的数据或数据集,数据本身存储在DateNodes中 NameNode知道HDFS中任何给定文件的块列表及其位置信息,当NameNode 关闭时,Hd 阅读全文

posted @ 2018-08-09 09:42 张的学习笔记 阅读(76) 评论(0) 推荐(0) 编辑

2018年8月8日 #

python学习笔记记录

摘要: 计算机基础知识: 随机存储器就是内存,缺点是断电数据丢失;优点:读写数据速度快。 外存储器硬盘 有点断电数据保存 缺点:读写速度慢 操作系统:是一个特异功能的程序,操作系统扮演了用户与计算机之间的桥梁作用,简化了操作 python的开发环境搭建: Python解释器和代码编辑器(pycharm) p 阅读全文

posted @ 2018-08-08 18:44 张的学习笔记 阅读(88) 评论(0) 推荐(0) 编辑