会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
虎啸千峰
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
···
10
下一页
2020年8月12日
Spark java.io.IOException: Can't get Master Kerberos principal for use as renewer 错误解决
摘要: 一、概述 当集群开启了Kerberos后,Spark向hive中写入数据时,代码中会去读取yarn的配置文件,如果读不到yarn的配置文件,就会报这样的错误。如果用IDEA开发的ETL程序直接在CDH上面运行是没有这个问题的;但是当程序在第三方机器上运行时就会包这个错误。因为Spark客户端需要将y
阅读全文
posted @ 2020-08-12 17:24 虎啸千峰
阅读(3834)
评论(0)
推荐(0)
2020年8月10日
Spark运行CDH6.3.2碰到的由于hive驱动引起的问题解决方法
摘要: 一、概述 spark使用hive中有比较多的坑,尤其是版本问题引起的jar包冲突,比较好的方式是使用与CDH匹配的hive和hadoop版本,这样可以减少很多的jar冲突问题,但是在IDEA调试过程中还是难免会碰到jar包冲突问题。 二、CDH6.3.2中碰到问题解决方法 1、java.lang.N
阅读全文
posted @ 2020-08-10 16:31 虎啸千峰
阅读(4002)
评论(0)
推荐(1)
2020年8月7日
Spark中碰到需要转义的|分隔符填坑方法
摘要: 一、概述 spark对离线数据进行ETL处理时,经常会碰到各式各样的分隔符,如果碰到的分隔符恰好有需要转义,就会引发一些错误,并且比较难以排查。比如我在项目中就碰到了客户的~|~作为分隔符的数据。因为需要在界面上输入,可把我坑惨了,花费了比较多的时间,在此记录一下。 二、问题解决 如果需要在在jso
阅读全文
posted @ 2020-08-07 19:13 虎啸千峰
阅读(2375)
评论(0)
推荐(0)
Spark2 Can't write dataframe to parquet hive table : HiveFileFormat`. It doesn't match the specified format `ParquetFileFormat`.
摘要: 一、概述 出现该问题的原因是因为 如果用命令行创建的hive表,会根据hive的hive.default.fileformat,这个配置来规定hive文件的格式,其中fileformat一般有4中,分别是TextFile、SequenceFile、RCFile、ORC。默认情况下,不指定的话,是Te
阅读全文
posted @ 2020-08-07 18:43 虎啸千峰
阅读(543)
评论(0)
推荐(0)
Spark连接CDH平台thriftserver和kerberos访问不一致错误排查
摘要: 一 、概述 在spark访问CDH平台时,如果同时访问两个CDH平台,如果登录的CDH平台中没有kerberos信息,而插入信息的CDH平台开启了Kerberos信息,就会报错误 Server asks us to fall back to SIMPLE auth, but this client
阅读全文
posted @ 2020-08-07 18:37 虎啸千峰
阅读(837)
评论(0)
推荐(0)
Spark运行中java.net.UnknownHostException: nameservice1的异常
摘要: 一、概述 使用IDEA调试spark程序时,spark通过thriftserver访问hive的元数据信息,如果不设置spark的warehouse目录会报nameservice1异常;这是因为本地目录访问不到nameservice信息,需要将nameservices配置到spark中。 二、问题解
阅读全文
posted @ 2020-08-07 18:28 虎啸千峰
阅读(4602)
评论(0)
推荐(0)
2020年8月5日
Kerberos的keytab文件生成和登录
摘要: 一、概述 kerberos是TDH和CDH平台常用的一种安全验证协议;在TDH中可以根据设置,直接登录到TDH安全协议模块下载keytab文件使用,但是在CDH平台中需要自己生成keytab文件。 二、CDH使用kerberos方式 1、进入到kerberos kadmin.local 2、查看ke
阅读全文
posted @ 2020-08-05 20:54 虎啸千峰
阅读(24730)
评论(0)
推荐(2)
2020年8月3日
报错java.lang.NoSuchFieldError: METASTORE_CLIENT_SOCKET_LIFETIME升级报错Required field 'client_protocol' is unset! 终级解决方案
摘要: 一、问题描述 最近碰到一个令人郁闷的问题,因为客户的CDH版本比较低,hive1.1.0版本,而我们现在使用的spark版本都比较近搞,这样就会造成,如果我使用hive1.1.0版本就会报错: java.lang.NoSuchFieldError: METASTORE_CLIENT_SOCKET_L
阅读全文
posted @ 2020-08-03 11:30 虎啸千峰
阅读(2326)
评论(0)
推荐(0)
2020年7月31日
Mysql编码不一致和时区相差14小时解决方法
摘要: 一、Oracle数据库是GBK编码导入到UTF-8的mysql数据库出现乱码 Oracle数据库有一套自己的编码方法,当客户端和数据库编码不一致时会自动转换编码方式;客户端获取数据时Oracle会自动将GBK转为UTF-8,因此,需要在Mysql的url上设置编码为UTF-8保持和mysql的一直即
阅读全文
posted @ 2020-07-31 09:24 虎啸千峰
阅读(1235)
评论(0)
推荐(0)
2020年7月15日
Datax执行job由于python版本引起的报错
摘要: 一、python版本问题报错显示 java.lang.Exception: File "/home/hundsun/workspace/dap/tools/bdata-datago/DataX/bin/datax.py", line 114 print readerRef ^SyntaxError:
阅读全文
posted @ 2020-07-15 14:26 虎啸千峰
阅读(1937)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
···
10
下一页
公告