上一页 1 2 3 4 5 6 7 8 9 10 ··· 28 下一页
摘要: 这两天抽时间又总结/整理了一下各种编码的实际编码方式,和在Java应用中的使用情况,在这里记录下来以便日后参考。为了构成一个完整的对文字编码的认识和深入把握,以便处理在Java开发过程中遇到的各种问题,特别是乱码问题,我觉得组成一个系列来描述和分析更好一些,包括三篇文章:第一篇:JAVA字符编码系列... 阅读全文
posted @ 2015-02-10 21:01 lujinhong 阅读(208) 评论(0) 推荐(0) 编辑
摘要: nutch将从网页中抓取到的信息放入hbase数据库中,默认情况下表名为$crawlId_webpage,但表中的内容以16进制进行表示,直接scan或者通过Java API进行读取均只能读取到16进制信息。 因此nutch提供了readdb选项进行数据获取,将表中的内容读取到一个文本中。具体用法... 阅读全文
posted @ 2015-02-10 14:59 lujinhong 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 转载自:http://www.cnblogs.com/liuling/p/2013-7-24-01.html另可参考:http://gengning938.blog.163.com/blog/static/128225381201141121326346/ 排序大的分类可以分为两种:内排序和外排序... 阅读全文
posted @ 2015-02-03 20:09 lujinhong 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 1、设置job的基础属性Job job = new Job();job.setJarByClass(***.class);job.setJobName(“job name”);job.setNumReduce(2);2、设置Map与Reudce的类job.setMappgerClass(*.clas... 阅读全文
posted @ 2015-02-02 21:33 lujinhong 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 1、 HBase is able to connect to ZooKeeper but the connection closes immediatelyhbase(main):001:0> listTABLE ERROR: org.apache.hadoop.hbase.ZooKeeperCon... 阅读全文
posted @ 2015-02-02 16:16 lujinhong 阅读(280) 评论(0) 推荐(0) 编辑
摘要: 参考官方文档:http://gora.apache.org/current/tutorial.html项目代码见:https://code.csdn.net/jediael_lu/mygorademo另环境准备见: http://blog.csdn.net/jediael_lu/article/de... 阅读全文
posted @ 2015-01-31 11:27 lujinhong 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 适用系统:Linux(Redhat , CentOS,Debian,Ubuntu)* Linux的云服务器数据盘未做分区和格式化,可以根据以下步骤进行分区以及格式化操作。下面的操作将会把数据盘划分为一个分区来使用。1、查看数据盘在没有分区和格式化数据盘之前,使用 “df –h”命令,是无法看到数据盘... 阅读全文
posted @ 2015-01-30 18:13 lujinhong 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 概述Gora是apache的一个开源项目。The Apache Gora open source framework provides an in-memory data model and persistence for big data. Gora supports persisting to ... 阅读全文
posted @ 2015-01-30 09:55 lujinhong 阅读(207) 评论(0) 推荐(0) 编辑
摘要: 参考官方文档:http://gora.apache.org/current/tutorial.html项目代码见:https://code.csdn.net/jediael_lu/mygorademo一、环境准备1、下载gora并解压2、分别进入$GORA_HOME/gora-hbase/,$GOR... 阅读全文
posted @ 2015-01-29 16:14 lujinhong 阅读(202) 评论(0) 推荐(0) 编辑
摘要: 参考http://wiki.apache.org/nutch/RunNutchInEclipse一、环境准备1、下载nutch2.3源代码wget http://mirror.bit.edu.cn/apache/nutch/2.3/apache-nutch-2.3-src.tar.gz或者下载正在开... 阅读全文
posted @ 2015-01-28 16:41 lujinhong 阅读(186) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 28 下一页