会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
虎啸千峰
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
10
下一页
2020年7月13日
Parquet模式写入分区错误修改
摘要: 一、概述 将数据以parquet模式写入到hive的分区表中时,底层源码有个错误,在进行分割字段判断时,没有引用已传入字符,多了一个“=”;该错误在hive的client中也会碰到 错误原因是底层分割符引用错误, 二、解决方法 从https://github.com/apache/parquet-m
阅读全文
posted @ 2020-07-13 20:25 虎啸千峰
阅读(328)
评论(0)
推荐(0)
2020年7月10日
Kerberos开启后TDH远程连接hive数据库
摘要: 一、TDH开启kerberos后登陆hive方式 TDH的hive是继承到平台中的,需要使用远程的方式连接hive数据库,当kerberos开启后,需要添加kerberos协议规则;使用方式如下 beeline -u 'jdbc:hive2://localhost:10000/demo;princi
阅读全文
posted @ 2020-07-10 10:40 虎啸千峰
阅读(1178)
评论(0)
推荐(0)
Kerberos报错:连接失败两种报错方法解决
摘要: 一、没有开通kerberos而使用kerberos方式连接报错 报错:Peer indicated failure: Unsupported mechanism type GSSAPI 这是因为hive所在集群已经关闭了kerberos,但是连接字符串还是采用kerberos方式就会爆此错误; 此时
阅读全文
posted @ 2020-07-10 10:18 虎啸千峰
阅读(6950)
评论(0)
推荐(0)
2020年7月8日
Datax写入parquet类型的hive表时处理timestamp类型字段的方法
摘要: 一、概述 1、 hive中的Timestamp Hive在0.8的版本后开始支持Timestamp的格式。Hive在储存时间戳的时候会先把时间转成UTC的时间,然后再把转换后的时间存储到Parquet文件中。在读取Parquet文件的时候Hive会把时间从UTC时间再转化回成本地的时间。这样的话,如
阅读全文
posted @ 2020-07-08 20:08 虎啸千峰
阅读(2708)
评论(0)
推荐(0)
2020年6月16日
Spark驱动包加载加载方式
摘要: 一、概述 Spark处理关系型数据库时需要加载关系型数据库的驱动,不然会报找不到驱动包的错误。一般根据Spark的使用不是不同有以下几种加载驱动包的方法。 二、加载驱动包的方法 1、使用--jars的命令 ./spark-submit --classs com.rdc.bdata.compute.j
阅读全文
posted @ 2020-06-16 15:15 虎啸千峰
阅读(2673)
评论(0)
推荐(0)
Maven多模块编译中遇到的坑
摘要: 一、概述 Maven使用过程中,如果使用多model的形式组织项目,单个模块之间是相互独立的;编译整个root目录时会对每个模块都进行统一编译。单单对某个模块进行编译,该模块不会对其他模块进行编译,即便是其引用的模块。 二、坑描述和解决方法 踩坑描述:在对一个通用jar包进行打包时,该模块对其他模块
阅读全文
posted @ 2020-06-16 10:50 虎啸千峰
阅读(2597)
评论(0)
推荐(0)
2020年6月12日
SparkSql 隐式转换异常
摘要: 一、Sparksql隐式转换时异常描述 Cannot create encoder for Option of Product type, because Product type is represented as a row, and the entire row can not be null
阅读全文
posted @ 2020-06-12 14:01 虎啸千峰
阅读(999)
评论(0)
推荐(0)
2020年6月10日
Spark fasterxml包冲突异常解决方法
摘要: 一、概述 在调试Spark项目的时候报了一个包冲突异常,找了好长时间,最后发现是包冲突了;特此记录一下,原始报错找不到了。一般包冲突有个明显的特征就是报类找不到异常,可以根据提示把Spark冲突的包排除掉,然后再把其他的把单独加上去,就可以解决了。 Caused by: java.lang.Numb
阅读全文
posted @ 2020-06-10 10:25 虎啸千峰
阅读(365)
评论(0)
推荐(0)
2020年6月8日
Spark-submit提交任务时由于写入window文件目录导致的错误
摘要: 一、概述 由于我们在使用spark编写时,使用文件一般都是从C://file//demo.txt,都是以文件盘符开始的,而Linux中没有盘符号,只有文件目录,例如:file:///home//demo//test//txt.json; 我们在进行本地测试时往往都是用的window,因此,直接把js
阅读全文
posted @ 2020-06-08 16:50 虎啸千峰
阅读(445)
评论(0)
推荐(0)
2020年6月5日
Linux搭建FTP服务器
摘要: 一、安装vsftpd 1、使用yum安装 yum install -y vsftpd 2、新增用户 useradd ftpuser 3、修改用户密码 echo "123456" | passwd ftpuser --stdin 4、限制该用户仅能通过FTP访问 限制用户 ftpuser只能通过 FT
阅读全文
posted @ 2020-06-05 20:19 虎啸千峰
阅读(2296)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
10
下一页
公告