• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
呢喃的歌声
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理

2019年9月5日

记录一次服务器大中间表优化的问题(数据倾斜的解决)
摘要: 背景:每天大数据平台核心就是出报表,而核心的中间表底层是大量的报表都会依赖它运行,我们称这个报表为142.(因为报表我们这边编号是142)。预计依赖于它的报表有几十个展示。 问题现象:每天142报表的运行时间达到10 15小时。导致底层报表计算大量延迟。于是进行报表排查和重整sql逻辑。 分析sql 阅读全文
posted @ 2019-09-05 13:35 呢喃的歌声 阅读(431) 评论(0) 推荐(0)
 
CDH spark2切换成anaconda3的问题
摘要: 最近spark2有同事想用anaconda3做开发,原因是上面可以跑机器学习的库(服务器因为没外网pip装whl确实麻烦) 1、先在每台机器安装anaconda3 2、把用户的~/.bashrc配置进Python的环境变量alias python=/opt/python/bin/python 3、把 阅读全文
posted @ 2019-09-05 13:14 呢喃的歌声 阅读(716) 评论(0) 推荐(0)
 
 

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3