随笔分类 -  hadoop

摘要:颜色区别: 蓝色:hive,橙色:Hbase。黑色hadoop 请简述hadoop怎样实现二级排序. 你认为用Java,Streaming,pipe 方式开发map/reduce,各有哪些优缺点: 6. 请列出在你以前工作中所使用过的开发map /reduce的语言java:scala:python 阅读全文
posted @ 2015-08-09 16:46 农民阿姨 阅读(1130) 评论(0) 推荐(0)
摘要:Hadoop 面试题之十 548.redis有什么特别之处,为什么用redis,用hbase 不行么? 答:redis 是基于内存的数据库,速度快 551.redis用什么版本? 3.0以上才支持集群 553.redis安装时候遇到什么问题? log日志文件不存在,需要自己创建才能成功 。redis-server /redis.conf redis-cli 514.Redis的基本类型 答... 阅读全文
posted @ 2015-08-09 11:24 农民阿姨 阅读(543) 评论(0) 推荐(1)
摘要:Hadoop 面试题之九 16.Hbase 的rowkey 怎么创建比较好?列族怎么创建比较好? 答: 19.Hbase 内部是什么机制? 答: 73.hbase 写数据的原理是什么? 答: 75.hbase宕机如何处理? 答: 144. 如果让你设计,你觉得一个分布式文件系统应该如何设计,考虑哪方面内容; 每天百亿数据入hbase,如何保证数据的存储正确和在规定的时间里全部... 阅读全文
posted @ 2015-08-09 11:23 农民阿姨 阅读(1364) 评论(0) 推荐(0)
摘要:此文章已于 23:19:00 2015/8/4 重新发布到 农民阿姨 Hadoop之MapReduce 提交任务 hadoop jar hadoopdemo-1.0-SNAPSHOT-jar-with-dependencies.jar /user/root/testmr/hello.txt /use 阅读全文
posted @ 2012-12-19 21:01 农民阿姨 阅读(419) 评论(0) 推荐(0)
摘要:安装其实很简单,把下载下来的Hadoop文件拷贝到相应的目录下,然后接压缩即可,关键是先要安装好JDK,前期的Linux要配置好。下面我把我的操作过程记录如下,供大家参考:登录到HadoopSrv01机器上,进行如下操作:1: su - grid2: tar -xvf hadoop-1.2.1-bi... 阅读全文
posted @ 2012-12-19 20:51 农民阿姨 阅读(206) 评论(0) 推荐(0)
摘要:1.序列化(Serialization)是指把结构化对象转化为字节流。 -写到内存2.反序列化(Deserialization)是序列化的逆过程。即把字节流转回结构化对象。-读到内存3.Java序列化(java.io.Serializable)java Serializable 是标志接口,在使用的... 阅读全文
posted @ 2012-12-19 14:02 农民阿姨 阅读(197) 评论(0) 推荐(0)
摘要:1.传输文件 hdfs fs –put hell / 2. jar包运行 hadoop jar wordcount.jar 3. 查看文件: hadoop fs -text /part-r-0000 4.查看文件大小 hadoop fs -du -h / 5.统计文件数据量 hdfs dfs -ls 阅读全文
posted @ 2012-12-18 15:01 农民阿姨 阅读(231) 评论(0) 推荐(0)