会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
HarkLee
打酱油
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
···
36
下一页
2020年2月2日
Hive清洗emoji及\0
摘要: 写的UDF public class FilterEmojiUDF extends UDF { public String evaluate(String str) { if (str == null || str == "") { return null; } else { StringBuild
阅读全文
posted @ 2020-02-02 08:33 HarkLee
阅读(1607)
评论(0)
推荐(0)
2020年2月1日
迁移hive表及hive数据
摘要: 公司hadoop集群迁移,需要迁移所有的表结构及比较重要的表的数据(跨云服务机房,源广州机房,目标北京机房) 1、迁移表结构 1)、老hive中导出表结构 hive -e "use db;show tables;" > tables.txt #!/bin/bash cat tables.txt |w
阅读全文
posted @ 2020-02-01 16:22 HarkLee
阅读(5459)
评论(0)
推荐(2)
2019年11月30日
检查一下主机安全情况
摘要: 1. who 查看当前登录用户2. last查看历史登录用户3. history 查看历史执行命令4. cat /var/log/secure | grep -i "accepted password" 查看成功登录记录信息5. cat /var/log/secure | grep -i "fail
阅读全文
posted @ 2019-11-30 15:08 HarkLee
阅读(197)
评论(0)
推荐(0)
2019年11月28日
hue创建的hdfs数据在hdfs无法删除的问题。
摘要: 在linux时删除时出现: 原来是用户组是文件是用户组admin。 但是我们linux系统中没有admin用户。 这时使用hadoop即可执行操作,因为是批量原因,所以我这边是把所有的文件所有者修改成 root了:
阅读全文
posted @ 2019-11-28 08:39 HarkLee
阅读(766)
评论(0)
推荐(0)
关于使用sudo找不到环境变量的问题
摘要: 参考这里:https://www.cnblogs.com/zhongshiqiang/p/10839666.html 使用sudo -E 保留当前用户环境,这时就不会存在找不到环境变量的问题了。
阅读全文
posted @ 2019-11-28 08:36 HarkLee
阅读(264)
评论(0)
推荐(0)
2019年11月2日
HDFS修改副本数,并生效。
摘要: 1、hadoop集群使用的ucloud的uahdoop 2、是公司集群配置小,只有两台core节点,实际就是两台的datanode。 容量占用超过了80%,需要缩减副本以空出容量。 3、查看 可以看到,每个文件三个副本。 4、执行 将所有的已经上传的副本从3个变成了两个 5、再执行第三步脚本确认。
阅读全文
posted @ 2019-11-02 15:30 HarkLee
阅读(3029)
评论(1)
推荐(0)
2019年6月19日
Linux创建用户,SFTP只允许访问指定目录
摘要: 首先创建用户 我这里配置lus1这个用户目录,为sftp指向目录,即/home/lus1/ 重启sshd服务 指定文件夹权限 这时,lus1即可SFTP登录,并且只能访问指定的目录。 但这时只能查看,不能上传。如果要实现上传,我们需要在当前目录建立当前用户有权限操作的目录: 这时,就可以进行上传操作
阅读全文
posted @ 2019-06-19 14:35 HarkLee
阅读(5730)
评论(2)
推荐(0)
2019年6月17日
【转】PostgreSQL与MySQL比较
摘要: 转自:https://www.cnblogs.com/geekmao/p/8541817.html PostgreSQL与MySQL比较 特性 MySQL PostgreSQL 实例 通过执行 MySQL 命令(mysqld)启动实例。一个实例可以管理一个或多个数据库。一台服务器可以运行多个 mys
阅读全文
posted @ 2019-06-17 15:26 HarkLee
阅读(690)
评论(0)
推荐(0)
2019年5月21日
HIVE出现Read past end of RLE integer from compressed stream Stream for column 1 kind LENGTH position: 359 length: 359 range: 0错误
摘要: 错误日志 环境: hive1.1.x ORC Snappy 原因: 使用 set hive.merge.mapfiles=true;set hive.merge.mapredfiles=true;set hive.merge.smallfiles.avgsize=256000000; 对小文件进行了
阅读全文
posted @ 2019-05-21 19:42 HarkLee
阅读(1695)
评论(0)
推荐(0)
2019年4月29日
HSDF查看各级目录的大小
摘要: hadoop fs -du -h /
阅读全文
posted @ 2019-04-29 10:01 HarkLee
阅读(390)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
36
下一页
公告