• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






南北极星

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2020年4月27日

selenium3环境搭建,Firefox与对应的geckodriver, chrome与对应的Chromedriver
摘要: Firefox与对应的geckodriver 火狐下载:http://ftp.mozilla.org/pub/firefox/releases/ geckodriver下载:https://github.com/mozilla/geckodriver/releases 版本对应关系: 经个人验证:F 阅读全文
posted @ 2020-04-27 13:09 南北极星 阅读(813) 评论(0) 推荐(0)
 
hadoop运行原理
摘要: 包括HDFS和Mapreduce两部分。 1)HDFS自动保存多个副本,移动计算。缺点是小文件存取占用namenode内存,写入只支持追加,不能随机修改。 它存储的逻辑空间称为block,文件的权限类似linux。整体架构分三种节点,NN,SNN,DN NN 负责读写操作保存metadata(Own 阅读全文
posted @ 2020-04-27 10:03 南北极星 阅读(410) 评论(0) 推荐(0)
 
数据仓库中数据处理和数据流转简要概述
摘要: 具体数仓甚至数据治理方面可以参考下图 按照数仓分层思想,分为ods贴源层、dw主题层、mid维表层、dm集市层、app应该层 过程如下: 1 数据通过采集或同步落地基于HDFS存储的ods层 2 主题抽取确认 3 如果有此需求,构建基于主题数据的微聚合结果 4 构建维表层数据,如时间、地区、产品类别 阅读全文
posted @ 2020-04-27 09:50 南北极星 阅读(1170) 评论(0) 推荐(0)
 
hbase的管理相关看法
摘要: 运维任务 regionserver添加/删除节点 master备份 1 添加新节点 复制hbase目录并进行配置文件修改(regionserver增加新节点)并保持配置文件在全集群一致,在新节点上启动相关进程如hbase-daemon.sh start regionserver命令 ​ 2 删除节点 阅读全文
posted @ 2020-04-27 09:47 南北极星 阅读(163) 评论(0) 推荐(0)
 
hbase的集群搭建
摘要: hbase集群搭建之前首先完成hadoop集群搭建 环境搭建 wget http://mirror.bit.edu.cn/apache/hbase/1.x.y/hbase-1.x.y-bin.tar.gz #解压 tar -xzvf hbase-1.x.y-bin.tar.gz -C /usr/lo 阅读全文
posted @ 2020-04-27 09:44 南北极星 阅读(133) 评论(0) 推荐(0)
 
hbase的架构
摘要: HBase中的存储包括HMaster、HRegionSever、HRegion、HLog、Store、MemStore、StoreFile、HFile等角色构成,具体如下HMaster的作用 1.为HRegionServer分配HRegion 2.负责HRegionServer的负载均衡 3.发现失 阅读全文
posted @ 2020-04-27 09:43 南北极星 阅读(364) 评论(0) 推荐(0)
 
如果让你处理hbase 怎么保证数据的安全性可靠性 不需要具体的设置 要一套方案
摘要: 有关数据安全及可靠我们认为大体上分为存储安全和使用安全 1 数据存储安全 hbase是基于hdfs的一种数据存储解决方案,所以有关数据的安全性可靠性可以利用hdfs自身的副本机制保障。另外原生的hbase(1.x)并没有提供数据备份机制,目前还是依赖于企业自身的研发保障,如阿里的云hbase进行数据 阅读全文
posted @ 2020-04-27 09:26 南北极星 阅读(734) 评论(0) 推荐(0)
 
架构方式
摘要: 架构方式 inmon架构 自上而下的开发模式,从多个数据源出发,根据需求将不同数据源的数据经过ETL过程获取到各个主题需求的数据集成到数仓中,完成了数据治理后再进行统计业务,将统计结果存入数据集市。 kimball架构 自下而上的开发模式,往往已经存在某个关系明确的业务数据库,架构师需要根据数据库中 阅读全文
posted @ 2020-04-27 09:24 南北极星 阅读(166) 评论(0) 推荐(0)