摘要:
随着大数据的越来越普及,HBase也变得越来越流行。使用HBase并不困难,但是如何用好HBase,这确是一个难点。为了合理地使用HBase,尽可能发挥HBase的功能,我们需要根据不同的场景对HBase进行不同地优化以最大程度上提升系统的性能。本文重点介绍列族设计有关的优化。我们先来了解下HBas 阅读全文
摘要:
电脑中或多或少的有很多敏感信息,尤其是大数据时代,信息一旦泄漏对我们造成的损失将会很大。有时候别人借用我们的电脑,有些信息不想让别人看到怎么办?有人会说有隐藏选项,但是,一旦开启显示隐藏文件,隐藏的文件夹又会暴露在视野里,那些用软件加密的软件又太复杂。下面的一段代码将让我们进行文件夹的加密。 加密手 阅读全文
摘要:
Hive 中,可以用String、Date和Timestamp表示日期时间,String 用 yyyy-MM-dd 的形式表示,Date 用 yyyy-MM-dd 的形式表示,Timestamp 用 yyyy-MM-dd hh:mm:ss 的形式表示。这三种数据类型在使用细节上,有一些需要注意的点: 阅读全文
摘要:
1.索引作用 在索引列上,除了上面提到的有序查找之外,数据库利用各种各样的快速定位技术,能够大大提高查询效率。特别是当数据量非常大,查询涉及多个表时,使用索引往往能使查询速度加快成千上万倍。 例如,有3个未索引的表t1、t2、t3,分别只包含列c1、c2、c3,每个表分别含有1000行数据组成,指为 阅读全文
摘要:
示例:想要取出每个课程前3名的学生信息、课程id,成绩与对应课程内排名 创建student表: s_id为学生id,s_name为学生姓名,s_sex为性别 创建score表: s_id 为学生id,c_id为课程id,s_score为对应的成绩 #内嵌部分: set @rank:=0; selec 阅读全文
摘要:
Region的迁移和合并 Region的拆分 Region的合并 Region冷合并 Region热合并 Region的拆分 随着大合并的增多,一个region越来越大,造成数据的存储不平衡,访问速度也会变慢。 所以,当region达到一定大小(默认10G),region会先下线,一分为二,分为两个 阅读全文
摘要:
一:标签自动补全: (1)纯标签补全 例:输入h1,按Tab键, (2)纯标签+地址“id” 例:输入h1#ccg,按Tab键, (3)纯标签+类“class” 例:输入h1.ccg,按Tab键, (4)标签+子标签+子标签个数 例:输入div>p*6,按Tab键, (5)标签+类+子标签+子标签个 阅读全文
摘要:
1. Azkaban是什么?Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的key:value对的方式,通过配置中的dependencies 来设置依赖关系,这个依赖关系必须是无环的,否则会被视为无效 阅读全文
摘要:
一. ZooKeeper是什么ZooKeeper由雅虎研究院开发,是Google Chubby的开源实现,后来托管到Apache,于2010年11月正式成为Apache的顶级项目。ZooKeeper是一个经典的分布式数据一致性解决方案,致力于为分布式应用提供一个高性能、高可用,且具有严格顺序访问控制 阅读全文
摘要:
总结一下:两种表达方式是等效的方法一: case when tb1.os = 'android' then 'android'when tb1.os = 'ios' then 'iPhone'else 'PC'end as os方法二: case tb1.oswhen 'android' then 阅读全文