会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
挪威森林猫
花有重开日 人无再少年
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
10
···
13
下一页
2020年6月2日
Java while循环的两种打断方式
摘要: 1>.条件式打断 Boolean bobo=true;int num= 0; while (bobo==true){ num+=1; if (num>10){ bobo=false; } } 通过对Boolean赋值 , 在循环过程中改变其 属性, 再次判断就可以直接退出while . 2>.直接
阅读全文
posted @ 2020-06-02 02:26 挪威森林猫Zzz
阅读(4344)
评论(0)
推荐(0)
2020年6月1日
HDFS 常见命令
摘要: 1. shell 获取 HDFS文件个数 >适用于查看碎片程度 hadoop fs -count /user | awk '{print $2}'11(我的返回是11) hadoop fs -count /user(你的路径) 返回的是 文件夹数 文件数 大小 | awk '{print $2}'
阅读全文
posted @ 2020-06-01 18:47 挪威森林猫Zzz
阅读(196)
评论(0)
推荐(0)
如何利用cnblog 的搜索库
摘要: 1. 自己blog 里面可以记录一些软件配置 , 常见 bug解决 , 以及知识点 但是有时候用起来却很难找, 不过 , cnblog有搜索功能 . 第一种方式:直接打开自己的一个博客 ,这里找找看就是搜索自己写的文章.快速检索. 第二种: 网站首页-->我的博客 -->管理 这样我们就进入了 找找
阅读全文
posted @ 2020-06-01 16:45 挪威森林猫Zzz
阅读(331)
评论(0)
推荐(0)
脚本启动集群 zookeeper , hadoop
摘要: 1.在NameNode的一个节点下执行以下命令 #!/bin/bash for i in 192.168.1.101 192.168.1.102 192.168.1.103 do ssh $i "source /etc/profile;source ~/.bash_profile;/home/abb
阅读全文
posted @ 2020-06-01 13:20 挪威森林猫Zzz
阅读(389)
评论(0)
推荐(0)
2020年5月28日
centos7 安装 TDengine
摘要: >1. TDengine是涛思公司的一款提供实时插入的类数据库系统. >2.我们采用rpm安装包 , 具体安装包下载 , 去官网 , https://www.taosdata.com/cn/ >3 . 我们通过 rpm -ivh 安装包名 进行安装 , 需要root 下执行 . 安装完 , 会提示怎
阅读全文
posted @ 2020-05-28 13:03 挪威森林猫Zzz
阅读(1540)
评论(0)
推荐(0)
2020年5月27日
Hadoop 无法实现HA
摘要: 1.问题描述 >启动完 node1 (standby) node2(active) kill掉 node2 node1无法切换成active!状态 2.解决. 文件是 hdfs-site.xml , value里面 不要分开写 , 直接这样就行了 . 也不要写成两个 . 就卸载这样一个 proper
阅读全文
posted @ 2020-05-27 17:44 挪威森林猫Zzz
阅读(156)
评论(0)
推荐(0)
2020年5月26日
Hive 常见设置
摘要: 1. Hive中 null 太多会占用大量空间 , 用这个可以减少占用 alter table test_null set serdeproperties('serialization.null.format' = ''); 2. 使用 sqoop 从mysql 和HIVE的 互相导入 mysql
阅读全文
posted @ 2020-05-26 15:35 挪威森林猫Zzz
阅读(304)
评论(0)
推荐(0)
Hive 查看表的文件个数(用于分析小文件)
摘要: 1. 进入DB 比如我的是 use hadoop; 2.找到需要查看的表 , 执行 desc formatted t1; 碎片文件太多 , 会让map 过多 ,然而启动map 极其耗费资源 , 甚至比计算都要费时间 .
阅读全文
posted @ 2020-05-26 12:07 挪威森林猫Zzz
阅读(4724)
评论(0)
推荐(0)
2020年5月25日
Hive 窄表转宽表 , 长表转宽表
摘要: 1.这是源数据以及需要转化的目标表. 我们的方法是 , 用 GROUP BY按照year分组 , 并且依次提取1月,2月,3月,4月的 num,具体实现 select year, max(case when month=1 then money else 0 end) as M1, max(case
阅读全文
posted @ 2020-05-25 15:50 挪威森林猫Zzz
阅读(2410)
评论(0)
推荐(0)
2020年5月24日
MapReduce 实现分片取TopN 再Reduce取TopN
摘要: ZX: 在Hadoop的map阶段 , 每个map任务都可以执行特殊的任务 , 当然 , 也包括取每个分片中最大的几个值. 然后汇总 , 再取TopN 这样的好处是 , 如果有2万个分片 , 2亿条数据 ,在Map完之后 假如是取Top10 , 那么经过Map阶段的Top10,最后只用处理2万X10
阅读全文
posted @ 2020-05-24 11:27 挪威森林猫Zzz
阅读(698)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
10
···
13
下一页
公告