会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
江东邮差
——时间是宝贵的
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
下一页
2022年6月28日
【转】Spark2.1和2.2 SQL物理执行策略关键源码分析
摘要: 1. 文章开始之前 先附上一句SQL,使用tpc-ds的表结构,我们围绕这句SQL讲。 SQL: SQL> select avg(cs_ext_discount_amt) from catalog_sales, date_dim where d_date between '1999-02-22' a
阅读全文
posted @ 2022-06-28 12:07 江东邮差
阅读(93)
评论(0)
推荐(0)
2022年6月23日
PostgreSQL位图计算 pg_roaringbitmap 插件
摘要: 链接:位图计算 pg_roaringbitmap 插件(腾讯云) 云数据库 PostgreSQL 提供 pg_roaringbitmap 插件,可以使用位图计算功能,提高查询性能。 前提条件 实例为云数据库 PostgreSQL 10、11、12、13 全新版本。 背景信息 Roaring Bitm
阅读全文
posted @ 2022-06-23 10:21 江东邮差
阅读(776)
评论(0)
推荐(0)
2022年6月15日
Mac系统使用homebrew安装组件时报错--fatal: not in a git directory Error: Command failed with exit 128: git
摘要: 报错 使用brew安装wget时报错 fatal: not in a git directory Error: Command failed with exit 128: git 解决办法 brew -v 查看会有两个提示,提示用户设置 homebrew-cask 和 homebrew-core 的
阅读全文
posted @ 2022-06-15 22:17 江东邮差
阅读(2733)
评论(0)
推荐(0)
[转]Spark自定义HBase数据源
摘要: 转发原文:Spark自定义HBase数据源 Spark内置很多数据源,却没有HBase的数据源,需要调用rdd的api,如果能有下面这种方式就非常完美了: frame.write.format("hbase") .mode(SaveMode.Append) .option(ZK_HOST_HBASE
阅读全文
posted @ 2022-06-15 16:31 江东邮差
阅读(209)
评论(0)
推荐(0)
2022年4月8日
【转】Spark SQL初体验之解析过程详解
摘要: 【转】Spark源码系列(九)Spark SQL初体验之解析过程详解 好久没更新博客了,之前学了一些R语言和机器学习的内容,做了一些笔记,之后也会放到博客上面来给大家共享。一个月前就打算更新Spark Sql的内容了,因为一些别的事情耽误了,今天就简单写点,Spark1.2马上就要出来了,不知道变动
阅读全文
posted @ 2022-04-08 16:28 江东邮差
阅读(206)
评论(0)
推荐(0)
【转】SparkSQL sql解析
摘要: 原文: 1. 背景 搞了快两年OLAP平台的开发,其中sql的解析优化通过SparkSQL完成,这里简单介绍一下原理 2. Demo 假设你已经搭建了spark,hive环境,我们这边查询下hive表,代码如下: 这里主要做了三件事: 1、构建SparkSession 2、执行sql构建DataFr
阅读全文
posted @ 2022-04-08 16:19 江东邮差
阅读(241)
评论(0)
推荐(0)
2022年3月29日
【转】PostgreSQL查看表膨胀(对所有表进行膨胀率排序)
摘要: 转发:PostgreSQL查看表膨胀(对所有表进行膨胀率排序) 1、查看表膨胀(对所有表进行膨胀率排序),取前10个 SELECT schemaname||'.'||relname as table_name, pg_size_pretty(pg_relation_size(schemaname||
阅读全文
posted @ 2022-03-29 20:37 江东邮差
阅读(943)
评论(0)
推荐(0)
【转】PostgreSQL表膨胀的前世今生
摘要: 转发:PostgreSQL表膨胀的前世今生 当你的数据库快速增长的时候,一定需要注意一件事,那就是“表膨胀”。内置的方法是使用VACUUM或者VACUUMFULL来解决表膨胀问题,但是有一些缺点。 [一、什么是表膨胀] PostgreSQL使用多版本模型MVCC。实现的方法和Oracle和MySQL
阅读全文
posted @ 2022-03-29 20:28 江东邮差
阅读(520)
评论(0)
推荐(0)
2022年3月27日
虚拟机Linux静态IP网络配置
摘要: 目标:虚拟机中Linux配置静态IP,防止连接不同网络时IP变更。 一、环境设置 VMware、Centos7 1.1 子网 本地windows用ipconfig查看网络信息。VMware子网设置,NAT模式,设置子网,与子网掩码对应。例如:子网掩码 255.255.255.0,子网设置为:192.
阅读全文
posted @ 2022-03-27 16:22 江东邮差
阅读(573)
评论(0)
推荐(0)
2022年1月24日
PG数据库表占用空间大小查询
摘要: 1.查看所有表所占磁盘空间大小 select sum(t.size) from ( SELECT table_schema || '.' || table_name AS table_full_name, pg_total_relation_size('"' || table_schema || '
阅读全文
posted @ 2022-01-24 14:27 江东邮差
阅读(8624)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
下一页
公告