TinyMark

2019年11月25日

摘要：点击compile即可开始下载！阅读全文

posted @ 2019-11-25 13:00 TinyMark 阅读(2455) 评论(0) 推荐(0)

2019年11月16日

摘要： 1.基本数据类型 Hive数据类型 Java数据类型长度例子 TINYINT byte 1byte有符号整数 20 SMALINT short 2byte有符号整数 20 INT int 4byte有符号整数 20 BIGINT long 8byte有符号整数 20 BOOLEAN boolea 阅读全文

posted @ 2019-11-16 18:32 TinyMark 阅读(1340) 评论(0) 推荐(0)

2019年10月30日

Hive建表与导入文件中的数据

摘要： Hive与Sql语言很像， use 数据库；以建一个student表为例：编写student.txt文件（中间以tab键隔开即 \t ） 2 Tiny3 Fun4 Mark5 Yong OK 阅读全文

posted @ 2019-10-30 20:41 TinyMark 阅读(1311) 评论(0) 推荐(0)

2019年10月29日

Hadoop编写一键集群全起start-cluster.sh、全关stop-cluster.sh、显示所有jps进程show-jps.sh脚本以及群起zookeeper服务，jps不显示的解决方案

摘要：一、首先进入：/usr/local/bin 文件夹下，编写start-cluster.sh脚本 vim start-cluster.sh (需要root权限) 下面的各个节点的信息根据自身情况进行修改保存，退出。修改执行权限 chmod 777 start-cluster.sh （或者u+x）运行阅读全文

posted @ 2019-10-29 20:58 TinyMark 阅读(1028) 评论(0) 推荐(0)

2019年10月22日

Zookeeper监听服务器节点动态上下线案例

摘要： 1．需求某分布式系统中，主节点可以有多台，可以动态上下线，任意一台客户端都能实时感知到主节点服务器的上下线。 2．需求分析 3．具体实现（0）先在集群上创建/servers节点：（1）服务器端向Zookeeper注册代码：（2）客户端代码要记得在运行时候main中args[ ]要事先配置哦阅读全文

posted @ 2019-10-22 20:50 TinyMark 阅读(823) 评论(0) 推荐(0)

2019年10月9日

自定义InputFormat案例实操

摘要：引言：无论HDFS还是MapReduce，在处理小文件时效率都非常低，但又难免面临处理大量小文件的场景，此时，就需要有相应解决方案。可以自定义InputFormat实现小文件的合并。（对外是一个整文件，对内仍是原先的小文件，节省MapTask）需求如下：将多个小文件合并成一个SequenceF 阅读全文

posted @ 2019-10-09 20:35 TinyMark 阅读(1181) 评论(0) 推荐(0)

2019年10月6日

wordCount实例在java上演示

摘要：首先打开dfs与yarn。主要就是三步走：一、编写WordcountMapper 二、编写WordcountReducer 三、编写WordcountDriver 多数都是固定写法，会用即可！顺便一提：如果在集群上运行： 1.maven install 打包之前的java程序为jar文件并改名阅读全文

posted @ 2019-10-06 17:54 TinyMark 阅读(388) 评论(0) 推荐(0)

2019年9月29日

群起集群start-dfs.sh 时，主节点一切正常，其他节点没有datanode等进程解决！和启动hadoop-deamon.sh权限不足问题

摘要：一、群起集群start-dfs.sh 时，主节点一切正常，其他节点没有datanode等进程以hadoop101（主节点）， hadoop102 ，hadoop103为例第一：ssh免密登陆设置失败，重新设置一遍。注意要在hadoop101中不仅设置当前用户对其他节点的免密登陆，还要设置roo 阅读全文

posted @ 2019-09-29 17:45 TinyMark 阅读(2109) 评论(0) 推荐(1)

2019年9月28日

编写集群分发脚本xsync 时的一些理解！

摘要：在该文件中编写如下代码保存文件之后，使其具有执行权限：chmod 777 xsync 最后执行该脚本：xsync /home/xxx/bin 如果显示无该路径，那么要配好环境变量里的path要包含上述的目的路径。欢迎留言交流！我的大数据菜鸟交流群（本群刚起步，有你更精彩）：875910806 阅读全文

posted @ 2019-09-28 15:35 TinyMark 阅读(2560) 评论(0) 推荐(0)

2019年9月27日

hadoop 同步sync时，报name or service not known错误解决方案

摘要：将两台机子打开 1：先ping x.x.x.x(另一台主机名称)，一般能ping通 2：ping hadoopxxx(另一台主机别名) 此时应该ping不通 3：vim /etc/hosts 4:service network restart 再ping别名就能ping通了解决！欢迎留言交流！我阅读全文

posted @ 2019-09-27 22:05 TinyMark 阅读(704) 评论(0) 推荐(0)

枪在手，跟我走！

公告