11 2014 档案

摘要:http://www.importnew.com/3020.html http://www.linuxidc.com/Linux/2014-01/95794.htm 1、概述 至于HMaster,HBase自身是不存在单点故障的。HBase使用ZooKeerper作为中央控制服务。ZooKeeper 阅读全文
posted @ 2014-11-29 10:33 lihui1625 阅读(256) 评论(0) 推荐(0)
摘要:1. Hadoop 下载hadoop-0.23.9-src.tar.gz, 解压, 在Linux 下编译, 其中会遇到各种错误,主要是linux 软件包安装问题 修改core-site.xml : 修改hdfs-site.xml: 修改master,设置SecondaryNameNode: 修改sl 阅读全文
posted @ 2014-11-26 10:04 lihui1625 阅读(126) 评论(0) 推荐(0)
摘要:Hadoop 19 November, 2014: 2.5.2 12 September, 2014: 2.5.1 11 August, 2014: 2.5.0 30 June, 2014: 2.4.1 27 June, 2014: 0.23.11 07 April, 2014: 2.4.0 20 阅读全文
posted @ 2014-11-24 17:21 lihui1625 阅读(823) 评论(0) 推荐(0)
摘要:1、减少节点 减少:graceful_stop.sh VA128 系统会把region从对应服务器上移出去,减少扰动。 重新启动节点: hbase-daemon.sh start regionserver 2、滚动重启 使用 hbase hbck 可以确认集群数据的一致性(meta 表) 3、新增服 阅读全文
posted @ 2014-11-14 16:01 lihui1625 阅读(153) 评论(0) 推荐(0)
摘要:1、垃圾回收优化 (1)、HMaster:通常不会产生问题,因为master没有处理任何过重的负载,并且实际的数据服务并不经过它。默认配置: -Dproc_master -XX:OnOutOfMemoryError=kill -9 %p -Xmx4g -XX:+UseConcMarkSweepGC 阅读全文
posted @ 2014-11-14 16:00 lihui1625 阅读(200) 评论(0) 推荐(0)
摘要:1、Context 监控实现: GangliaContext : 推送至Ganglia FileContext: 写入文件 TimeStampingFileContext: 写入文件,带时间戳 CompositeContext: 多个实现 NullContext: 不监控 NullContextWi 阅读全文
posted @ 2014-11-14 15:59 lihui1625 阅读(584) 评论(0) 推荐(0)
摘要:1、行健设计 (1)、存储方式:磁盘上一个列族下所有的单元格都存储在一个存储文件(store file)中,不同列族的单元格不会出现在同一个存储文件中。 (2)、NULL 不会存储在HBase表中。 (3)、每个单元格在实际存储时也保存了行健和列键,即单独存储了它在表中所处位置的相关信息。 (4)、 阅读全文
posted @ 2014-11-14 15:59 lihui1625 阅读(138) 评论(0) 推荐(0)
摘要:1、入门 面向列族: 物理上所有列族成员都一起存放在文件系统中,调优和存储都是在列族这个层次上进行,最好所有列族成员都有相同的访问模式。 -ROOT-表: 包含.META. 表的区域列表。 .META. 表: 包含所有用户空间区域的列表,以区域名为键。 区域名: 表名+起始行+创建时间+MD5,例子 阅读全文
posted @ 2014-11-14 15:58 lihui1625 阅读(118) 评论(0) 推荐(0)
摘要:1、入门 面向列族: 物理上所有列族成员都一起存放在文件系统中,调优和存储都是在列族这个层次上进行,最好所有列族成员都有相同的访问模式。 -ROOT-表: 包含.META. 表的区域列表。 .META. 表: 包含所有用户空间区域的列表,以区域名为键。 区域名: 表名+起始行+创建时间+MD5,例子 阅读全文
posted @ 2014-11-14 15:58 lihui1625 阅读(91) 评论(0) 推荐(0)
摘要:使用场合: 1、从文件读取数据导入HBase 2、从HBase 读取数据 阅读全文
posted @ 2014-11-14 15:58 lihui1625 阅读(110) 评论(0) 推荐(0)
摘要:1、REST 支持现有的基于Web的体系,能够完美融合反向代理和其他缓存技术,并行运行许多Rest服务可以分摊他们之间的负载。 2、Thrift / Avro 当用户吞吐量角度考虑需要的最佳性能,可以使用严谨的二进制协议。 3、HBase Shell hbase shell 基于JRuby 状态信息 阅读全文
posted @ 2014-11-14 11:39 lihui1625 阅读(166) 评论(0) 推荐(0)
摘要:1、创建表 hbaseAdmin.createTable(htableDescriptor); hbaseAdmin.createTable(htableDescriptor, splitKeys); hbaseAdmin.createTable(htableDescriptor, startKey 阅读全文
posted @ 2014-11-14 10:50 lihui1625 阅读(230) 评论(0) 推荐(0)
摘要:1、比较运算符 CompareFilter.CompareOp.LESS CompareFilter.CompareOp.LESS_OR_EQUAL CompareFilter.CompareOp.EQUAL CompareFilter.CompareOp.NOT_EQUAL CompareFilt 阅读全文
posted @ 2014-11-14 10:49 lihui1625 阅读(238) 评论(0) 推荐(0)
摘要:1、概述 (1)、HBase 所有修改数据的操作保证行级别的原子性。 (2)、用户应该尽量使用批处理(batch)更新,减少单独操作同一行数据的次数。 (3)、创建表有代价,所以只创建一个HTable,一般在应用程序开始时创建 (4)、使用HTablePool,复用多个实例,例子 2、PUT操作 ( 阅读全文
posted @ 2014-11-13 14:54 lihui1625 阅读(207) 评论(0) 推荐(0)
摘要:1、硬件条件 (1)、CPU: Master Host 双四核,2.0GHz-2.5GHz Slave Host 双四核,2.0GHz-2.5GHz (2)、内存 (Heap): NameNode 8GB SecondaryNameNode 8GB DataNode 1GB HMaster 4GB 阅读全文
posted @ 2014-11-13 14:24 lihui1625 阅读(120) 评论(0) 推荐(0)
摘要:1、列式存储数据库 不同于传统关系数据库的行式存储。其优势为: (1)、对于特定查询,不是所有值都是必需的,可减少IO。 (2)、列的数据类型相似,有利于压缩,返回结果时降低带宽消耗。 2、HBase 的Region 和RegionServer 每一个region 只能由一台region serve 阅读全文
posted @ 2014-11-12 17:47 lihui1625 阅读(110) 评论(0) 推荐(0)
摘要:1、创建表: create table immutable_local (id varchar not null primary key, cf1.a varchar, cf1.b varchar, cf2.c varchar, cf2.d varchar ) immutable_rows=true 阅读全文
posted @ 2014-11-12 08:57 lihui1625 阅读(282) 评论(0) 推荐(0)
摘要:分别创建表: create table my_mutable (id varchar not null primary key, cf1.a varchar , cf1.b varchar, cf2.c varchar, cf2.d varchar) ; create table my_immuta 阅读全文
posted @ 2014-11-09 15:33 lihui1625 阅读(162) 评论(0) 推荐(0)
摘要:统计收集有助于提升query性能。 命令: UPDATE STATISTICS my_table 等效于 UPDATE STATISTICS my_table ALL 如果只收集index或者column 等效于 UPDATE STATISTICS my_table ALL 如果只收集index或者 阅读全文
posted @ 2014-11-09 14:23 lihui1625 阅读(168) 评论(0) 推荐(0)
摘要:只支持Hadoop2 配置 hadoop-metrics2-phoenix.properties 配置 hadoop-metrics2-hbase.properties 配置 hbase-site.xml <configuration> <property> <name>phoenix.trace. 阅读全文
posted @ 2014-11-09 13:59 lihui1625 阅读(267) 评论(0) 推荐(0)
摘要:The List<List<KeyRange>> for SkipScanFilter for the above query would be [ [ [ a - b ], [ d - e ] ], [ 1, 2 ] ] where [ [ a - b ], [ d - e ] ] is the 阅读全文
posted @ 2014-11-09 13:45 lihui1625 阅读(125) 评论(0) 推荐(0)
摘要:组合使用order by, > , LIMIT : 阅读全文
posted @ 2014-11-09 13:37 lihui1625 阅读(108) 评论(0) 推荐(0)
摘要:creating a table: CREATE TABLE regions ( region_name VARCHAR PRIMARY KEY, zips VARCHAR ARRAY[10], CONSTRAINT pk PRIMARY KEY (region_name)); Insert sel 阅读全文
posted @ 2014-11-09 13:32 lihui1625 阅读(133) 评论(0) 推荐(0)
摘要:创建多租户表: 连接到某租户的数据库表: Properties props = new Properties(); props.setProperty("TenantId", "Acme"); Connection conn = DriverManager.getConnection("localh 阅读全文
posted @ 2014-11-09 12:21 lihui1625 阅读(225) 评论(0) 推荐(0)
摘要:1、IN 和 Not In 的子查询 SELECT ItemName FROM Items WHERE ItemID IN (SELECT ItemID FROM Orders WHERE Date >= to_date('2013/09/02')); 2、Exists 和Not Exists的子查 阅读全文
posted @ 2014-11-09 11:44 lihui1625 阅读(297) 评论(0) 推荐(0)
摘要:1、immutable Index 原文:Immutable indexing targets use cases that are write once, append only; this is common in time-series data, where you log once, bu 阅读全文
posted @ 2014-11-09 11:37 lihui1625 阅读(215) 评论(0) 推荐(0)
摘要:在Property里面设置属性 "CurrentSCN"。 ts是一个long。 Properties props = new Properties(); props.setProperty(PhoenixRuntime.CURRENT_SCN_ATTRIB, Long.toString(ts)); 阅读全文
posted @ 2014-11-09 11:26 lihui1625 阅读(257) 评论(0) 推荐(0)
摘要:1、加盐: 加盐可以将数据存入多个region里,从而提升读写性能。 CREATE TABLE TEST (HOST VARCHAR NOT NULL PRIMARY KEY, DESCRIPTION VARCHAR) SALT_BUCKETS=42 如果有16台region server,每台se 阅读全文
posted @ 2014-11-09 11:08 lihui1625 阅读(212) 评论(0) 推荐(0)
摘要:因为HBase 数据储存按照 row key 排序,如果HBase表的 row key 是单调递增的,则HBase 容易有RegionServer 的局部热点问题。加盐可以缓解这个问题。 create table H3 (id varchar not null primary key, cf1.a 阅读全文
posted @ 2014-11-08 17:46 lihui1625 阅读(338) 评论(0) 推荐(0)
摘要:1、Phoenix 主要技术点 a、将SQL转化为HBase Scan,将结果封装为JDBC Result Set。 b、表的元数据保存在HBase表(系统表)中。 c、使用了coprocessor 和 custom filter 保证高效,使得小规模查询的延时在毫秒级,百万行的查询延时在秒级。 c 阅读全文
posted @ 2014-11-08 17:45 lihui1625 阅读(133) 评论(0) 推荐(0)
摘要:pheonix_jdbc.properties 文件 PhoenixQueryUtils: 用例: 输出: 阅读全文
posted @ 2014-11-06 18:34 lihui1625 阅读(229) 评论(0) 推荐(0)
摘要:pheonix_jdbc.properties 文件driverClassName=org.apache.phoenix.jdbc.PhoenixDriverurl=jdbc:phoenix:10.1.20.129,10.1.20.128,10.1.20.44:2181username=userp... 阅读全文
posted @ 2014-11-06 18:34 lihui1625 阅读(159) 评论(0) 推荐(0)
摘要:pheonix_jdbc.properties 文件 driverClassName=org.apache.phoenix.jdbc.PhoenixDriverurl=jdbc:phoenix:10.1.20.129,10.1.20.128,10.1.20.44:2181username=user... 阅读全文
posted @ 2014-11-06 18:31 lihui1625 阅读(176) 评论(0) 推荐(0)
摘要:pheonix_jdbc.properties 文件 Java 代码 阅读全文
posted @ 2014-11-06 18:31 lihui1625 阅读(175) 评论(0) 推荐(0)
摘要:inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish )。 DbUtils是一个小型的类库,这里通过具体实例来说明如何使用DbUtils。示例分为3个类:DbUtilsExample演示了如何使用DbUtils 类;QueryRunnerEx 阅读全文
posted @ 2014-11-06 18:23 lihui1625 阅读(337) 评论(0) 推荐(0)
摘要:inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish )。 DbUtils是一个小型的类库,这里通过具体实例来说明如何使用DbUtils。示例分为3个类:DbUtilsExample演示了如何使用DbUtils 类;QueryRunnerE... 阅读全文
posted @ 2014-11-06 18:23 lihui1625 阅读(246) 评论(0) 推荐(0)
摘要:syslog架构Unix/Linux系统中的大部分日志都是通过一种叫做syslog的机制产生和维护的。syslog是一种标准的协议,分为客户端和服务器端,客户端是产生日志消息的一方,而服务器端负责接收客户端发送来的日志消息,并做出保存到特定的日志文件中或者其他方式的处理。在Linux中,常见的sys... 阅读全文
posted @ 2014-11-06 18:22 lihui1625 阅读(550) 评论(0) 推荐(1)
摘要:1. 没有插入值的字段(即为Null的字段),在HBase中不会存储实际数据。 创建表: create table t1 (id varchar not null primary key, cf1.a varchar, cf1.b varchar, cf2.c varchar,cf2.d varch 阅读全文
posted @ 2014-11-06 09:57 lihui1625 阅读(222) 评论(0) 推荐(0)
摘要:AVG ( numericTerm ) COUNT (Term) COUNT (DISTINCT Term) MAX ( term ) MIN ( term ) SUM ( numericTerm ) PERCENTILE_CONT( 0.9 ) WITHIN GROUP (ORDER BY X A 阅读全文
posted @ 2014-11-05 22:51 lihui1625 阅读(2607) 评论(0) 推荐(0)
摘要:与一般数据库一样。 INTEGER java.lang.Integer -2147483648 to 2147483647 (4 byte ) UNSIGNED_INT java.lang.Integer 0 to 2147483647 (4 byte ) BIGINT java.lang.Long 阅读全文
posted @ 2014-11-05 22:30 lihui1625 阅读(2584) 评论(0) 推荐(0)
摘要:String username = ""; String password = ""; String url = "jdbc:phoenix:10.1.20.129, 10.1.20.124, 10.1.20.44"; Connection connection = null; Statement 阅读全文
posted @ 2014-11-05 21:42 lihui1625 阅读(339) 评论(0) 推荐(0)
摘要:SVNKit (JavaSVN) 是一个纯 Java 的 SVN 客户端库,使用 SVNKit 无需安装任何 SVN 的客户端,支持各种操作系统。 这不是一个开源的类库,但你可以免费使用.SVNLogClient的方法doLog() 'svn log' doList(... 阅读全文
posted @ 2014-11-05 18:24 lihui1625 阅读(739) 评论(0) 推荐(0)
摘要:http://blog.csdn.net/shaobingj126/article/details/7260907Network Time Protocol(NTP,网络时间协议)用于同步它所有客户端时钟的服务。NTP服务器将本地系统的时钟与一个公共的NTP服务器同步然后作为时间主机提供服务,使本地... 阅读全文
posted @ 2014-11-05 18:05 lihui1625 阅读(117) 评论(0) 推荐(0)
摘要:http://blog.csdn.net/shaobingj126/article/details/7260907 Network Time Protocol(NTP,网络时间协议)用于同步它所有客户端时钟的服务。NTP服务器将本地系统的时钟与一个公共的NTP服务器同步然后作为时间主机提供服务,使本 阅读全文
posted @ 2014-11-05 18:05 lihui1625 阅读(220) 评论(0) 推荐(0)
摘要:http://blog.csdn.net/hursing/article/details/17553571使用 crontab sudo crontab -e打开后加入这行[plain] view plaincopy0 * * * * my_user_name my_script_path ... 阅读全文
posted @ 2014-11-05 17:52 lihui1625 阅读(459) 评论(0) 推荐(0)
摘要:Phoenix中 创建一个表: 0: jdbc:phoenix:localhost> create table test ( id varchar not null primary key, cf1.a varchar, cf1.b varchar, cf2.c varchar , cf2.d va 阅读全文
posted @ 2014-11-02 22:10 lihui1625 阅读(210) 评论(0) 推荐(0)