会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
微威
多言数穷,不如守中。
博客园
首页
新随笔
联系
订阅
管理
1
2
下一页
2021年4月13日
spark 数据读取关系型数据库或写入到关系型数据库问题
摘要: spark读取关系型数据库大表jdbc OOM 除非获取大小设置为Integer.MIN_VALUE ,否则JDBC驱动程序总是获取所有行. 默认情况下,ResultSets被完全检索并存储在内存中。 在大多数情况下,这是最有效的操作方式,并且由于MySQL网络协议的设计更容易实现。 如果您正在使用
阅读全文
posted @ 2021-04-13 17:08 foola
阅读(599)
评论(1)
推荐(0)
2021年2月23日
spring项目启动 卡在项目初始化
摘要: 问题日志 02-23 14:49:12 INFO o.s.c.s.PostProcessorRegistrationDelegate$BeanPostProcessorChecker: Bean 'org.springframework.transaction.annotation.ProxyTra
阅读全文
posted @ 2021-02-23 16:07 foola
阅读(1756)
评论(0)
推荐(0)
2020年6月23日
sqoop 并行读取oracle
摘要: 报错信息 2020-06-19 16:57:44: ==〇^^^L\ = = Sqoop执行不成功! Warning: /usr/hdp/2.5.3.0-37/accumulo does not exist! Accumulo imports will fail. Please set SACCUM
阅读全文
posted @ 2020-06-23 10:05 foola
阅读(626)
评论(0)
推荐(0)
2020年6月5日
hive 查询表数据量大小
摘要: 为什么要查询表数据量 在做数据仓库管理时,数据导入hive或向表生成数据形成的数据资产,表里的数据量和占用存储空间是重要的元数据属性。为方便数据使用时计算资源的分配,对数据要有基本的了解,所以需要对表的数据量做统计。 使用 analyze table 主动生成元数据信息 analyze table
阅读全文
posted @ 2020-06-05 12:02 foola
阅读(26932)
评论(4)
推荐(8)
2020年5月25日
oracleSQL 转 SPARKSQL(hiveSql) 及常用优化
摘要: 背景 数据处理平台从oracle迁移到hadoop平台后,原有的数据处理过程需要改写为sparkSql。由于sparkSql执行环境和数据的不确定,经常有资源竞争导致处理过程意外停止,数据倾斜导致任务执行失败。 为减少出错概率,需要对sparkSql进行规范与优化。 转换 exist 转换 为 le
阅读全文
posted @ 2020-05-25 18:44 foola
阅读(1087)
评论(0)
推荐(0)
2020年5月20日
OGG FOR BigData(Hive) OracleGoldenGate 性能测试
摘要: 版本信息: Oracle GoldenGate Command Interpreter Version 12.2.0.1.160419 OGGCORE_12.2.0.1.0OGGBP_PLATFORMS_160430.1401 Linux, x64, 64bit (optimized), Gener
阅读全文
posted @ 2020-05-20 19:09 foola
阅读(1074)
评论(0)
推荐(0)
2020年5月11日
数据质量通用规则
摘要: 数据治理 数据质量规则 目的 数据治理分析的重要前提是有数据且有正确的数据可以提供分析。数据质量的把控,应是后续工作的重中之重。为数据挖掘、预测、数据分析算法的合理使用、多维查询、即席分析、数据可视化等工作做好支撑,让数据质量不再是空中楼阁。数据质量不高表现为数据以多种格式,杂乱无序的存在于内外部的
阅读全文
posted @ 2020-05-11 18:15 foola
阅读(8797)
评论(0)
推荐(0)
2020年4月29日
给定一个字符串(只包含小写英文字母),按顺序执行以下两条规则,输出计算后的字符串。
摘要: 题目规则 规则 1:对于连续顺序4位及以上的字母,中间使用“~”替换。 例如:ahhhhhhbcdefko, 替换后为ahhhhhhb~fko。 规则2:对于连续重复出现3个及以上的字母,以该字母+重复的个数替换。 例如:ahhhhhhbcdefko,替换后为ah6bcdefko。 总体示例: 输入
阅读全文
posted @ 2020-04-29 11:19 foola
阅读(1825)
评论(0)
推荐(0)
2020年4月14日
mybatis 分页失败 始终pageSize = 2147483647
摘要: 是在使用分页查询时 this.jobReadMapper.beginPager(pageParam);XXXXXXXXXXXXXXXXXXXXXXXXthis.xxxReadMapper.queryById(xxx); this.jobReadMapper.endPager(this.jobRead
阅读全文
posted @ 2020-04-14 10:53 foola
阅读(839)
评论(0)
推荐(0)
ambari hdp ssh链接错误
摘要: 错误信息: ERROR 2019-09-05 10:29:05,700 NetUtil.py:96 - EOF occurred in violation of protocol (_ssl.c:579)ERROR 2019-09-05 10:29:05,700 NetUtil.py:97 - SS
阅读全文
posted @ 2020-04-14 09:52 foola
阅读(287)
评论(0)
推荐(0)
1
2
下一页
公告