上一页 1 2 3 4 5 6 7 ··· 20 下一页
摘要: 阅读全文
posted @ 2020-04-30 16:24 Tim&Blog 阅读(292) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-04-30 15:57 Tim&Blog 阅读(365) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-04-30 15:56 Tim&Blog 阅读(201) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-04-30 15:55 Tim&Blog 阅读(400) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-04-30 15:54 Tim&Blog 阅读(246) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-04-30 15:53 Tim&Blog 阅读(909) 评论(0) 推荐(0)
摘要: ORC表与其他表的区别1. 只有TEXT、CSV、基于定宽文本文件外表这三种表支持对 字段类型 的修改以及增、删字段。2. 禁止修改ORC表的字段类型3. 禁止对ORC表增、删字段 ORC表建立的原则ORC非事务表的建表只需在建表语句中用 STORED AS ORC 指定存储格式为ORC即可。ORC 阅读全文
posted @ 2020-04-30 15:52 Tim&Blog 阅读(987) 评论(0) 推荐(0)
摘要: beeline使用方式1. 无认证./beeline -u jdbc:hive2://{inceptor_server}:100002. 使用Kerberos认证kinit -kt /etc/sql2/hive.keytab hive/baogang2@TDHklistTicket cache: F 阅读全文
posted @ 2020-04-30 15:50 Tim&Blog 阅读(830) 评论(0) 推荐(0)
摘要: Inceptor命令01-表介绍 • 表的划分-不同维度 1. 按 Inceptor的所有权 分类可分为:外部表(或简称为外表)和托管表(内表)。 2. 按 表的存储格式 分类可分为:TEXT表、ORC表、CSV表和Holodesk表。 3. 按表 是否分区 可分为:分区表和非分区表。 4. 按表 阅读全文
posted @ 2020-04-30 15:48 Tim&Blog 阅读(1668) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-04-21 13:34 Tim&Blog 阅读(214) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-04-20 14:05 Tim&Blog 阅读(144) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-04-20 14:04 Tim&Blog 阅读(190) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-04-20 13:21 Tim&Blog 阅读(189) 评论(0) 推荐(0)
摘要: Presto是什么? Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。 Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。 它可以做什么? Presto支持在线数据查询,包括Hive, Cassa 阅读全文
posted @ 2020-04-10 09:59 Tim&Blog 阅读(851) 评论(1) 推荐(0)
摘要: 问题:发现存在一张表中存在相同的两行数据 得到:仅仅保留一行数据 方法: 原理-我们通过 1 select count (字段1,字段2) from 表1; 2 3 结果 200条数据 4 5 select count (distinct 字段1,字段2) from 表1; 6 7 结果 100条数 阅读全文
posted @ 2020-04-08 08:32 Tim&Blog 阅读(5427) 评论(0) 推荐(0)
摘要: 1、概述 1.1、所有的join连接,都可以加上类似where a.id='1000'的条件,达到同样的效果。 1.2、除了cross join不可以加on外,其它join连接都必须加上on关键字,后都可加where条件。 1.3、虽然都可以加where条件,但是他们只在标准连接的结果集上查找whe 阅读全文
posted @ 2020-03-13 13:46 Tim&Blog 阅读(800) 评论(0) 推荐(0)
摘要: holodesk为了权衡列式存储的解压带来的性能影响,采用的是行列式混合存储架构,这种架构再压缩列重复数据时会比单纯的列式存储架构的压缩比要小; orc表采用的列式压缩方式,对列重复数据具有很好的压缩性能,所以两种表类型对应的压缩格式不同,导致两种表在重复数据较多时占用的存储空间相差较大; 当然,这 阅读全文
posted @ 2020-03-12 10:16 Tim&Blog 阅读(1072) 评论(0) 推荐(0)
摘要: 机制:TDH里面数据删除之后,会在hdfs下面生成delta的文件,该文件在下次该表修改时候进行删除compact合并 也就是说我们要在compact之前,删除delta即可恢复到最新的一次版本 --比如新建一个分糖数为3的orc事务表,新建成功之后,存在一个delta版本,下面存在3个bucket 阅读全文
posted @ 2020-03-06 13:37 Tim&Blog 阅读(1150) 评论(0) 推荐(0)
摘要: IDEA自带的注释模板不是太好用,我本人到网上搜集了很多资料系统的整理了一下制作了一份比较完整的模板来分享给大家,我不是专业玩博客的,写这篇文章只是为了让大家省事。 这里设置的注释模板采用Eclipse的格式,下面先贴出Eclipse的注释模板,我们就按照这种格式来设置: 类注释模板: 方法注释模板 阅读全文
posted @ 2020-03-02 10:04 Tim&Blog 阅读(12959) 评论(0) 推荐(0)
摘要: 从文件到kafka # flume-directory-kafka.conf: A single-node Flume configuration # Name the components on this agent a3.sources = r3 a3.sinks = k3 a3.channel 阅读全文
posted @ 2020-02-19 11:01 Tim&Blog 阅读(293) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 ··· 20 下一页