11 2018 档案

摘要:HBase 的安装有两种方式:单机安装和分布式安装。HBase的单机安装了解即可,大家重点掌握HBase 分布式集群的安装。下面我们分别进行介绍。 HBase 单机安装 HBase 需要运行在 Hadoop 基础之上,因此安装HBase 的前提是必须安装 Hadoop 环境。我的环境安装的是hado 阅读全文
posted @ 2018-11-30 23:47 乀崋 阅读(972) 评论(0) 推荐(0)
摘要:1、基础环境配置 NameNode、ResourceManager、SecondaryNameNode、 DataNode、NodeManager 1.1、关闭防火墙和SELinux 1.1.1、关闭防火墙 1.1.2、关闭SELinux 注:以上操作需要使用root用户 1.2、hosts配置 注 阅读全文
posted @ 2018-11-28 10:28 乀崋 阅读(1064) 评论(0) 推荐(0)
摘要:linux安装mysql服务分两种安装方法: 1、源码安装,优点是安装包比较小,只有十多M,缺点是安装依赖的库多,安装编译时间长,安装步骤复杂容易出错。 2、使用官方编译好的二进制文件安装,优点是安装速度快,安装步骤简单,缺点是安装包很大,376M左右。我这里官方编译好的Linux二进制包安装mys 阅读全文
posted @ 2018-11-25 13:28 乀崋 阅读(1091) 评论(0) 推荐(0)
摘要:学习连接:http://www.runoob.com/redis/redis-tutorial.html 一、Redis介绍 Redis是NoSql的一种。 NoSql,全名:Not Only Sql,是一种非关系型数据库,它不能替代关系弄数据库,只是关系型数据库的一个补充,是可以解决高并发、高可用 阅读全文
posted @ 2018-11-24 21:27 乀崋 阅读(5556) 评论(2) 推荐(1)
摘要:一、java 开发环境的搭建 在windows 环境下怎么配置环境。 1.首先安装JDK java的sdk简称JDK ,去其官方网站下载JDK。 https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-21331 阅读全文
posted @ 2018-11-16 22:43 乀崋 阅读(568) 评论(0) 推荐(0)
摘要:以前都是在自己电脑的上创建多套虚拟机,现在买了薄本,搭建不了虚拟机,更不要说搭建多台。一直想搭建轻量级的虚拟机,但是VirtualBox、Virtual PC等都试过了,要么windows家庭版不支持,要么就是搭建起来笔记本吃不消。 想到了阿里云服务器,但是发现仍旧太贵了,哈哈。 我自己有台台式机, 阅读全文
posted @ 2018-11-16 21:14 乀崋 阅读(267) 评论(0) 推荐(0)
摘要:大数据总体架构 、知识图谱总体架构、NLP总体架构 阅读全文
posted @ 2018-11-15 11:16 乀崋 阅读(3583) 评论(0) 推荐(0)
摘要:转载自:https://blog.csdn.net/wen_demon/article/details/44155639 1. INFORMATICA CLIENT的使用1.1 Repository Manager 的使用1.1.1 创建Repository。前提: a. 在ODBC数据源管理器中新 阅读全文
posted @ 2018-11-15 08:21 乀崋 阅读(2050) 评论(0) 推荐(0)
摘要:一、企业级数据中心应用推广中的弊端 1.电网企业数据中心建设多厂商、多技术形态,导致不同的各类数据分散,难以有统一的操作平台,gbase、SG-RDB(Mysql)、Hadoop、Informatica、等等。 2.企业数据中心建成后,支撑各业务部门开展大数据分析应用建设,每一个业务部门背后都有其固 阅读全文
posted @ 2018-11-14 21:13 乀崋 阅读(356) 评论(0) 推荐(0)
摘要:Hbase的访问方式 1、Native Java API:最常规和高效的访问方式; 2、HBase Shell:HBase的命令行工具,最简单的接口,适合HBase管理使用; 3、Thrift Gateway:利用Thrift序列化技术,支持C++,PHP,Python等多种语言,适合其他异构系统在 阅读全文
posted @ 2018-11-14 15:04 乀崋 阅读(1480) 评论(0) 推荐(0)
摘要:图1 大数据技能体系 一、数据库-熟悉两个产品Oracle、Gbase 8a。 二、数据仓库-4年企业(电网)数据仓库建设。 三、BI工具-熟悉一款BI产品Tableau。 四、ETL-掌握一类产品Informatica。 五、编程语言-java已不掌握,自学python,sql还熟悉一些。 六、h 阅读全文
posted @ 2018-11-14 15:03 乀崋 阅读(545) 评论(0) 推荐(0)
摘要:get命令和HTable类的get()方法用于从HBase表中读取数据。使用 get 命令,可以同时获取一行数据。它的语法如下: 下面的例子说明如何使用get命令。扫描emp01表的第一行。 读取指定列 下面给出的是语法,使用get方法读取指定列。 下面给出的示例,是用于读取HBase表中的特定列。 阅读全文
posted @ 2018-11-14 09:02 乀崋 阅读(494) 评论(0) 推荐(0)
摘要:安装简要说明新版本的kafka自带有zookeeper,其实自带的zookeeper完全够用,本篇文章以记录使用自带zookeeper搭建kafka集群。1、关于kafka下载kafka下载页面:http://kafka.apache.org/downloads2、修改kafka配置文件kafka安 阅读全文
posted @ 2018-11-06 20:40 乀崋 阅读(629) 评论(0) 推荐(0)