lujinhong2

2015年11月19日

博客已迁移至http://blog.csdn.net/lujinhong2/

摘要： http://blog.csdn.net/lujinhong2/ 请继续关注阅读全文

posted @ 2015-11-19 18:40 lujinhong2 阅读(239) 评论(0) 推荐(0)

2015年10月8日

摘要： Java多线程基础 @(博客文章)[java] 一、基础内容 1、线程的基本概念（1）一个线程是一个程序内部的顺序控制流。（2）线程和进程 –每个进程都有独立的代码和数据空间(进程上下文)，进程切换的开销大。 –线程：轻量的进程，同一类线程共享代码和数据空间，每个线程有独立... 阅读全文

posted @ 2015-10-08 18:35 lujinhong2 阅读(210) 评论(0) 推荐(0)

2015年7月29日

storm-kafka编程指南

摘要： #storm-kafka编程指南@(博客文章)[kafka|大数据|storm][toc]#一、原理及关键步骤介绍storm中的storm-kafka组件提供了storm与kafka交互的所需的所有功能，请参考其官方文档：https://github.com/apache/storm/tree/ma... 阅读全文

posted @ 2015-07-29 17:16 lujinhong2 阅读(1291) 评论(0) 推荐(0)

storm原理介绍

摘要： #storm原理介绍@(博客文章)[storm|大数据] [toc]#一、原理介绍待补充#二、配置完整的默认配置文件见下面defaluts.yaml，若需要修改，则在storm.yaml中修改。重要参数如下：1、storm.zookeeper.servers：指定使用哪个zookeeper集群```... 阅读全文

posted @ 2015-07-29 17:15 lujinhong2 阅读(1105) 评论(0) 推荐(0)

storm集群操作指南

摘要： #storm集群操作指南@(博客文章)[storm|大数据] [toc]#一、storm伪分布式安装##（一）环境准备1、OS：debian 72、JDK 7.0##（二）安装zookeeper1、下载zookeeper并解压 wget http://mirror.bit.edu.cn/apache... 阅读全文

posted @ 2015-07-29 17:14 lujinhong2 阅读(557) 评论(0) 推荐(0)

storm编程指南

摘要： #storm编程指南@(博客文章)[storm|大数据][toc]本文介绍了storm的基本编程，关于trident的编程，请见？？？本示例使用storm运行经典的wordcount程序，拓扑如下：sentence-spout—>split-bolt—>count-bolt—>report-bolt... 阅读全文

posted @ 2015-07-29 17:13 lujinhong2 阅读(375) 评论(0) 推荐(1)

trident原理及编程指南

摘要： #trident原理及编程指南@(博客文章)[storm|大数据][toc]#一、理论介绍##1、trident是什么？Trident is a high-level abstraction for doing realtime computing on top of Storm. It allow... 阅读全文

posted @ 2015-07-29 17:11 lujinhong2 阅读(1257) 评论(0) 推荐(0)

kafka集群原理介绍

摘要： #kafka集群原理介绍@(博客文章)[kafka|大数据] [toc] 本系统文章共三篇，分别为1、kafka集群原理介绍了以下几个方面的内容：（1）kafka基础理论（2）参数配置（3）错误处理（4）kafka集群在zookeeper集群中的内容2、kafka集群操作介绍了kafka集群的安装与... 阅读全文

posted @ 2015-07-29 17:10 lujinhong2 阅读(8478) 评论(0) 推荐(1)

kafka集群操作指南

摘要： #kafka集群操作指南@(博客文章)[kafka|大数据][toc]本系统文章共三篇，分别为1、kafka集群原理介绍了以下几个方面的内容：（1）kafka基础理论（2）参数配置（3）错误处理（4）kafka集群在zookeeper集群中的内容2、kafka集群操作介绍了kafka集群的安装与操作... 阅读全文

posted @ 2015-07-29 17:06 lujinhong2 阅读(8154) 评论(0) 推荐(0)

2015年7月27日

【转载】zookeeper数据模型

摘要： [转载请注明作者和原文链接, 如有谬误, 欢迎在评论中指正. ]ZooKeeper的数据结构, 与普通的文件系统极为类似. 见下图:图片引用自developerworks图中的每个节点称为一个znode. 每个znode由3部分组成:stat. 此为状态信息, 描述该znode的版本, 权限等信息.... 阅读全文

posted @ 2015-07-27 09:56 lujinhong2 阅读(457) 评论(0) 推荐(0)

2015年7月24日

java.util.logging使用笔记2

摘要： java.util.logging是java自带的日志处理系统，其功能不如log4j/logback强大，但可以完成基本的日志需求。另外，如果在一个项目中使用log4j, 而这个项目引用的第3方包也使用了log4j，它们之间的配置文件会互相覆盖，导致不可预知的结果。如果第3方包将配置文件公开了，可以通过修改log4j.properties来满足自己的需求（如hadoop），如果没有公开，而是打包... 阅读全文

posted @ 2015-07-24 11:05 lujinhong2 阅读(5356) 评论(0) 推荐(0)

2015年7月22日

spark提交应用的方法(spark-submit)

摘要：参考自：https://spark.apache.org/docs/latest/submitting-applications.html常见的语法：./bin/spark-submit\--class--master\--deploy-mode\--conf=\...#otheroptions\[application-arguments]举几... 阅读全文

posted @ 2015-07-22 11:06 lujinhong2 阅读(25698) 评论(0) 推荐(0)

2015年7月21日

spark集群模式概述

摘要：英文原文地址：https://spark.apache.org/docs/latest/cluster-overview.html集群模式概述本文档简单介绍了spark如何在集群中运行，它使得你更容易理解spark相关的组件。关于如何在一个集群中运行spark，请参考application subm... 阅读全文

posted @ 2015-07-21 22:40 lujinhong2 阅读(477) 评论(0) 推荐(0)

[spark]spark 编程教程

摘要：参考：英文：https://spark.apache.org/docs/latest/programming-guide.html中文：http://www.cnblogs.com/lujinhong2/p/4651025.html1.2.1版本的（一）快速入门老规矩，先看一个简单示例，有个认识。这个示例来自官方example的SparkPi：package org.lujinhong.de... 阅读全文

posted @ 2015-07-21 11:52 lujinhong2 阅读(718) 评论(0) 推荐(0)

2015年7月20日

[spark]Spark Streaming教程

摘要：（一）官方入门示例废话不说，先来个示例，有个感性认识再介绍。这个示例来自spark自带的example，基本步骤如下：（1）使用以下命令输入流消息：$ nc -lk 9999（2）在一个新的终端中运行NetworkWordCount，统计上面的词语数量并输出：$ bin/run-example streaming.NetworkWordCount localhost 9999（3）在第一步创建的... 阅读全文

posted @ 2015-07-20 10:20 lujinhong2 阅读(1157) 评论(0) 推荐(0)

2015年7月17日

使用github pages创建博客

摘要：参考：http://wenku.baidu.com/link?url=hi0nlkIp17HnQQpCkUr3KacZOOVGMOYKYbWzjX_HKJZNZpiRxfGPLuwvUydOVxeZM10e7TiDknWCj2i6qUW1Kzu-GWHL_WPYYSCuBBxDhxqhttp://www.docin.com/p-888648541.html以上是同一篇文章：GitHub+mark... 阅读全文

posted @ 2015-07-17 14:18 lujinhong2 阅读(399) 评论(0) 推荐(0)

spark 编程教程

摘要：参考：英文：https://spark.apache.org/docs/latest/programming-guide.html中文：http://www.cnblogs.com/lujinhong2/p/4651025.html1.2.1版本的（一）快速入门老规矩，先看一个简单示例，有个认识。这个示例来自官方example的SparkPi：package org.lujinhong.de... 阅读全文

posted @ 2015-07-17 14:17 lujinhong2 阅读(447) 评论(0) 推荐(0)

2015年7月16日

Spark编程指南V1.4.0(翻译)

摘要：转载自：http://blog.csdn.net/sdujava2011/article/details/46878153?utm_source=tuicool英文地址：https://spark.apache.org/docs/latest/programming-guide.htmlSpark编... 阅读全文

posted @ 2015-07-16 13:22 lujinhong2 阅读(765) 评论(0) 推荐(0)

mysql基本操作

摘要：（一）基本操作1、创建用户使用的数据库mysql -u root -p#然后输入密码mysql> create database filter_conf;Query OK, 1 row affected (0.08 sec)mysql> show databases;+---------------... 阅读全文

posted @ 2015-07-16 10:58 lujinhong2 阅读(236) 评论(0) 推荐(0)

2015年7月15日

在scala中调用java代码

摘要：详细代码请见https://github.com/lujinhong/scalademo在scala中调用java代替非常非常简单，直接调用即可（一）一个简单示例1、创建一个java类package com.lujinhong.demo.scala;public class MyJavaClass { public int adder(int a, int b){ return a+b; }... 阅读全文

posted @ 2015-07-15 17:53 lujinhong2 阅读(10452) 评论(0) 推荐(0)

Scala文件操作

摘要：完整代码请见：https://github.com/lujinhong/scalademo本示例完成了Scala文件中的一些常见操作，包括读取文件并输出，把内容写入一个文件等。直接上代码：package org.lujinhong.demo.scalaimport scala.io.Sourceim... 阅读全文

posted @ 2015-07-15 17:10 lujinhong2 阅读(1112) 评论(0) 推荐(0)

2015年7月14日

sbt教程

摘要：更详细内容请见：http://www.scala-sbt.org/0.13/tutorial/Basic-Def.html或者http://wenku.baidu.com/link?url=oKjFBumGoaqqUS7CEnTJdgEYK5r7rdsoT6367ZICG7isAtJKd3NRyawqq-seZuUf8jIwRbCojzBwMSRF4Rm4qFKWEWD9JTeUC90_Vin... 阅读全文

posted @ 2015-07-14 19:02 lujinhong2 阅读(998) 评论(0) 推荐(0)

2015年7月13日

如何用MarsEdit快速插入源代码

摘要：转自：http://www.cnblogs.com/xiaosilent/p/3470858.html开始用MarsEdit来写博文，客户端的，毕竟是要方便的多啊。遇到的第一个问题就是：MarsEdit没有提供快速插入源代码的工具，而对于我这枚码农而言，这个就有点太杯具了。简单研究了一下，发现Mar... 阅读全文

posted @ 2015-07-13 12:41 lujinhong2 阅读(201) 评论(0) 推荐(0)

Spark Streaming教程

摘要：废话不说，先来个示例，有个感性认识再介绍。这个示例来自spark自带的example，基本步骤如下：（1）使用以下命令输入流消息：$ nc -lk 9999（2）在一个新的终端中运行NetworkWordCount，统计上面的词语数量并输出：$ bin/run-example streaming.NetworkWordCount localhost 9999（3）在第一步创建的输入流程中敲入一些... 阅读全文

posted @ 2015-07-13 11:49 lujinhong2 阅读(897) 评论(0) 推荐(0)

2015年7月10日

protocol buffer介绍(protobuf)

摘要：一、理论概述0、参考资料入门资料：https://developers.google.com/protocol-buffers/docs/javatutorial更详细的资料：For more detailed reference information, see the Protocol Buffer Language Guide, the Java API Reference, the Jav... 阅读全文

posted @ 2015-07-10 21:45 lujinhong2 阅读(534) 评论(0) 推荐(0)

2015年6月6日

sqoop 1.4.4-cdh5.1.2快速入门分类： C_OHTERS 2015-06-06 11:40 208人阅读评论(0) 收藏

摘要：一、快速入门（一）下载安装1、下载并解压wget http://archive.cloudera.com/cdh5/cdh/5/sqoop-1.4.4-cdh5.1.2.tar.gztar -zxvf sqoop-1.4.4-cdh5.1.2.tar.gz2、将sqoop中的命令添加至$PATH中e... 阅读全文

posted @ 2015-06-06 11:40 lujinhong2 阅读(210) 评论(0) 推荐(0)

hadoop的关键进程分类： A1_HADOOP 2015-06-06 11:37 52人阅读评论(0) 收藏

摘要： hadoop集群中主要进程有master: NameNode, ResourceManager,slaves: DataNode, NodeManager, RunJar, MRAppMaster,YarnChild其中 RunJar, MRAppMaster,YarnChild与随着某个job的创... 阅读全文

posted @ 2015-06-06 11:37 lujinhong2 阅读(194) 评论(0) 推荐(0)

HIVE快速入门分类： B4_HIVE 2015-06-06 11:27 59人阅读评论(0) 收藏

摘要：（一）简单入门1、创建一个表create table if not exists ljh_emp(name string,salary float,gender string)comment 'basic information of a employee'row format delimited ... 阅读全文

posted @ 2015-06-06 11:27 lujinhong2 阅读(218) 评论(0) 推荐(0)

2015年5月6日

公钥，私钥和数字签名这样最好理解分类： B3_LINUX 2015-05-06 16:25 59人阅读评论(0) 收藏

摘要：一、公钥加密假设一下，我找了两个数字，一个是1，一个是2。我喜欢2这个数字，就保留起来，不告诉你们(私钥），然后我告诉大家，1是我的公钥。我有一个文件，不能让别人看，我就用1加密了。别人找到了这个文件，但是他不知道2就是解密的私钥啊，所以他解不开，只有我可以用数字2，就是我的私钥，来解密。这样我就... 阅读全文

posted @ 2015-05-06 16:25 lujinhong2 阅读(206) 评论(0) 推荐(0)

2015年4月28日

mysql快速入门分类： B6_MYSQL 2015-04-28 14:31 284人阅读评论(0) 收藏

摘要： debian方式：apt-get install mysql-server-5.5mysql -u root -predhat安装方式一、下载并解压 $ wget http://cdn.mysql.com/Downloads/MySQL-5.5/MySQL-5.5.42-1.el6.x86_64.rpm-bundle.tar 解压后得到以下几个文件： $ tar -xvf MySQL-5.5... 阅读全文

posted @ 2015-04-28 14:31 lujinhong2 阅读(152) 评论(0) 推荐(0)

spark原理介绍分类： B8_SPARK 2015-04-28 12:33 1039人阅读评论(0) 收藏

摘要： 1、spark是一个基于内存计算的开源的集群计算系统，目的是让数据分析更加快速。因此运行spark的机器应该尽量的大内存，如96G以上。2、spark所有操作均基于RDD，操作主要分成2大类：transformation与action。3、spark提供了交互处理接口，类似于shell的使用。4、s... 阅读全文

posted @ 2015-04-28 12:33 lujinhong2 阅读(191) 评论(0) 推荐(0)

spark1.3.1使用基础教程分类： B8_SPARK 2015-04-28 11:10 1651人阅读评论(0) 收藏

摘要： spark可以通过交互式命令行及编程两种方式来进行调用：前者支持scala与python 后者支持scala、python与java本文参考https://spark.apache.org/docs/latest/quick-start.html，可作快速入门再详细资料及用法请见https://spark.apache.org/docs/latest/programming-guide.ht... 阅读全文

posted @ 2015-04-28 11:10 lujinhong2 阅读(215) 评论(0) 推荐(0)

2015年4月27日

安装hadoop2.6.0伪分布式环境分类： A1_HADOOP 2015-04-27 18:59 409人阅读评论(0) 收藏

摘要：集群环境搭建请见：http://blog.csdn.net/jediael_lu/article/details/45145767一、环境准备1、安装linux、jdk2、下载hadoop2.6.0，并解压3、配置免密码ssh（1）检查是否可以免密码： $ ssh localhost（2）若否：$ ... 阅读全文

posted @ 2015-04-27 18:59 lujinhong2 阅读(175) 评论(0) 推荐(0)

安装spark1.3.1单机环境分类： B8_SPARK 2015-04-27 14:52 1873人阅读评论(0) 收藏

摘要：本文介绍安装spark单机环境的方法，可用于测试及开发。主要分成以下4部分：（1）环境准备（2）安装scala（3）安装spark（4）验证安装情况1、环境准备（1）配套软件版本要求：Spark runs on Java 6+ and Python 2.6+. For the Scala API, ... 阅读全文

posted @ 2015-04-27 14:52 lujinhong2 阅读(187) 评论(0) 推荐(0)

2015年4月24日

在sublime text 3中安装中文支持分类： C_OHTERS 2015-04-24 22:04 229人阅读评论(0) 收藏

摘要： 1、安装package control使用control+~打开终端，然后输入以下内容并确定：import urllib.request,os;pf='Package Control.sublime-package';ipp=sublime.installed_packages_path();url... 阅读全文

posted @ 2015-04-24 22:04 lujinhong2 阅读(177) 评论(0) 推荐(0)

2015年4月20日

搭建hadoop2.6.0集群环境分类： A1_HADOOP 2015-04-20 07:21 459人阅读评论(0) 收藏

摘要：一、规划（一）硬件资源 10.171.29.191 master10.171.94.155 slave110.251.0.197 slave3（二）基本资料用户： jediael 目录：/mnt/jediael/ 二、环境配置（一）统一用户名密码，并为jediael赋予执行所有命令的权限 #p... 阅读全文

posted @ 2015-04-20 07:21 lujinhong2 阅读(193) 评论(0) 推荐(0)

2015年4月12日

在mac中导入hadoop2.6.0源代码至eclipse 分类： A1_HADOOP 2015-04-12 09:27 342人阅读评论(0) 收藏

摘要：一、环境准备1、安装jdk、maven等2、下载hadoop源代码，并解压3、将tools.jar复制到Classes中，具体原因见http://wiki.apache.org/hadoop/HowToSetupYourDevelopmentEnvironmentcd $JAVA_HOME mkdi... 阅读全文

posted @ 2015-04-12 09:27 lujinhong2 阅读(156) 评论(0) 推荐(0)

2015年4月10日

Maven基础教程分类： C_OHTERS 2015-04-10 22:53 232人阅读评论(0) 收藏

摘要：更多内容请参考官方文档：http://maven.apache.org/guides/index.html 官方文档很详细，基本上可以查找到一切相关的内容。另外，快速入门可参考视频：孔浩的maven视频。一、快速入门（一）搭建环境1、下载maven，并将之解压或者直接使用yum 来安装2、配置环境变... 阅读全文

posted @ 2015-04-10 22:53 lujinhong2 阅读(171) 评论(0) 推荐(0)

2015年4月3日

centos中的配置文件分类： B3_LINUX 2015-04-03 22:21 184人阅读评论(0) 收藏

摘要： /etc/profile:此文件为系统的每个用户设置环境信息,当用户第一次登录时,该文件被执行.并从/etc/profile.d目录的配置文件中搜集shell的设置./etc/bashrc:为每一个运行bash shell的用户执行此文件.当bash shell被打开时,该文件被读取.~/.bash... 阅读全文

posted @ 2015-04-03 22:21 lujinhong2 阅读(173) 评论(0) 推荐(0)

2015年3月15日

Hbase写数据，存数据，读数据的详细过程分类： B7_HBASE 2015-03-15 20:11 117人阅读评论(0) 收藏

摘要： Client写入 -> 存入MemStore，一直到MemStore满 -> Flush成一个StoreFile，直至增长到一定阈值 -> 出发Compact合并操作 -> 多个StoreFile合并成一个StoreFile，同时进行版本合并和数据删除 -> 当StoreFiles Compact后... 阅读全文

posted @ 2015-03-15 20:11 lujinhong2 阅读(187) 评论(0) 推荐(0)

公告