上一页 1 ··· 4 5 6 7 8 9 10 11 12 13 下一页
  2021年1月15日
摘要: 数组的用法:https://www.jianshu.com/p/e57c4e5f607b 查询系统函数:select * from system.functions; ┌─name────────────────────────────────────────┬─is_aggregate─┬─cas 阅读全文
posted @ 2021-01-15 17:26 大鹏的鸿鹄之志 阅读(1092) 评论(0) 推荐(0)
  2020年12月15日
摘要: 平时很少用到map类型,这次用到了记录一下。 适用场景:行转列,且mid的key个数可能不一样的情况。 举个栗子: 1 select 2 mid, 3 tags['电影'] as movie, 4 tags['音乐'] as music 5 from( 6 select 7 mid, 8 str_t 阅读全文
posted @ 2020-12-15 20:57 大鹏的鸿鹄之志 阅读(1438) 评论(0) 推荐(0)
  2020年12月1日
摘要: ClickHouse存储层 ClickHouse从OLAP场景需求出发,定制开发了一套全新的高效列式存储引擎,并且实现了数据有序存储、主键索引、稀疏索引、数据Sharding、数据Partitioning、TTL、主备复制等丰富功能。以上功能共同为ClickHouse极速的分析性能奠定了基础。 列式 阅读全文
posted @ 2020-12-01 20:47 大鹏的鸿鹄之志 阅读(1122) 评论(0) 推荐(0)
  2020年11月25日
摘要: Hive的后端存储是HDFS,它对大文件的处理是非常高效的,如果合理配置文件系统的块大小,NameNode可以支持很大的数据量。但是在数据仓库中,越是上层的表其汇总程度就越高,数据量也就越小。而且这些表通常会按日期进行分区,随着时间的推移,HDFS的文件数目就会逐渐增加。 小文件带来的问题 关于这个 阅读全文
posted @ 2020-11-25 20:23 大鹏的鸿鹄之志 阅读(1195) 评论(0) 推荐(0)
摘要: 转载:https://blog.csdn.net/young_0609/article/details/109275517 阅读全文
posted @ 2020-11-25 17:38 大鹏的鸿鹄之志 阅读(287) 评论(0) 推荐(0)
摘要: 转载:https://blog.csdn.net/weixin_46163590/article/details/106191042?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3. 阅读全文
posted @ 2020-11-25 17:17 大鹏的鸿鹄之志 阅读(403) 评论(0) 推荐(0)
  2020年11月15日
摘要: 转载:http://lxw1234.com/archives/2015/04/185.htm 数据准备: d1,user1,1000 d1,user2,2000 d1,user3,3000 d2,user4,4000 d2,user5,5000 CREATE EXTERNAL TABLE lxw12 阅读全文
posted @ 2020-11-15 14:50 大鹏的鸿鹄之志 阅读(201) 评论(0) 推荐(0)
  2020年11月11日
摘要: 1,https://blog.csdn.net/yangwenlei222/article/details/81112618?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~all~sobaiduend~default- 阅读全文
posted @ 2020-11-11 17:35 大鹏的鸿鹄之志 阅读(774) 评论(0) 推荐(1)
  2020年10月12日
摘要: 转载:https://www.cnblogs.com/shimingjie/p/11912624.html 转载:https://www.cnblogs.com/laov/p/3434917.html Map阶段包括: 第一读数据:从HDFS读取数据 1、问题:读取数据产生多少个Mapper? Ma 阅读全文
posted @ 2020-10-12 17:15 大鹏的鸿鹄之志 阅读(1736) 评论(2) 推荐(0)
  2020年10月9日
摘要: 转载:https://mp.weixin.qq.com/s/8M31uSlNt5vC34R4Xr1dZA 如果把指标⽐喻成⼀棵树上的果实,那模型就是这棵⼤树的躯⼲,想让果实结得好,必须让树⼲变得粗壮。真实场景举例:⼤多数公司的分析师会结合业务做⼀些数据分析(需要⽤到⼤量的数据),通过报表的⽅式服务于 阅读全文
posted @ 2020-10-09 11:21 大鹏的鸿鹄之志 阅读(313) 评论(0) 推荐(0)
上一页 1 ··· 4 5 6 7 8 9 10 11 12 13 下一页