随笔档案「2014年7月」 - feshy

在Eclipse上操作Hive-0.13.1-JDBC端口

摘要：fesh个人实践，欢迎经验交流！本文Blog地址：http://www.cnblogs.com/fesh/p/3877740.html 完成《在Hadoop-2.2.0集群上安装 Hive-0.13.1 with MySQL》后，这里具体介绍JDBC接口，如果是以集群中的节点作为客户端来访问H... 阅读全文

posted @ 2014-07-30 16:12 feshy 阅读(670) 评论(0) 推荐(0)

在Hadoop-2.2.0集群上安装 Hive-0.13.1 with MySQL

摘要：Hive可以理解为在Hadoop和HDFS之上为用户封装一层便于用户使用的接口。Hive需要将元数据存储在RDBMS中，这对于Hive的运行是非常重要的。阅读全文

posted @ 2014-07-28 12:23 feshy 阅读(2578) 评论(0) 推荐(0)

Apache Spark-1.0.1集群搭建

摘要：Spark是一个高效的分布式计算系统，相比Hadoop，它在性能上比Hadoop要高100倍。Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台，它克服了MapReduce在迭代式计算和交互式计算方面的不足，通过引入RDD（Resilient Distributed Datasets）数据表示模型，能够很好地解决MapReduce不易解决的问题。相比于MapReduce，Spark能够充分利用内存资源提高计算效率。阅读全文

posted @ 2014-07-25 00:43 feshy 阅读(996) 评论(0) 推荐(1)

导航目录

摘要：一、基础学习Java正则表达式 Maven-3.2.2安装配置|转载：PuTTY的自动登录设置Ubuntu中vi常用命令|Ubuntu-12.04-server 配置修改静态 IP地址|二、大数据（Hadoop,Spark...）1）编译安装Ubuntu12.04-x64编译Hadoop2.2.0和... 阅读全文

posted @ 2014-07-24 11:09 feshy 阅读(368) 评论(0) 推荐(0)

Maven-3.2.2安装配置

摘要：（1）安装JDK，这里是1.7.0_51（2）Maven-3.2.2下载地址：http://mirrors.cnnic.cn/apache/maven/maven-3/3.2.2/binaries/apache-maven-3.2.2-bin.tar.gz（3）解压tar -zxvf apache-... 阅读全文

posted @ 2014-07-24 10:14 feshy 阅读(2575) 评论(0) 推荐(0)

Spark-1.0.1 的make-distribution.sh编译、SBT编译、Maven编译三种编译方法

摘要：Spark编译阅读全文

posted @ 2014-07-24 01:11 feshy 阅读(3492) 评论(0) 推荐(0)

Mahout源码分析之 -- QR矩阵分解

摘要：一、算法原理请参考我在大学时写的《QR方法求矩阵全部特征值》，其包含原理、实例及C语言实现：http://www.docin.com/p-114587383.html二、源码分析这里有一篇文章《使用MapRedece进行QR分解的步骤》可以看看/** For an m x n matrix A wi... 阅读全文

posted @ 2014-07-23 12:20 feshy 阅读(388) 评论(0) 推荐(0)

Java正则表达式

摘要：1、匹配括号及括号内的内容，如“(**)”Pattern Pattern1 = Pattern.compile("\$.+\$") 2、匹配汉字+数字，如“电视01”Pattern Pattern1 = Pattern.compile("[\u4e00-\u9fa5]+[0-9]+$");正... 阅读全文

posted @ 2014-07-14 14:37 feshy 阅读(210) 评论(0) 推荐(0)

IntelliJ IDEA13.1.3+Scala2.11.1环境搭建

摘要：Intellij IDEA的使用性非常好，是一个非常优秀的IDE，也是很好的scala开发工具。这里对构建Intellij IDEA的Scala开发环境进行介绍，包含在Windows环境和Ubuntu环境下的安装配置。阅读全文

posted @ 2014-07-08 10:31 feshy 阅读(3755) 评论(0) 推荐(0)

导航

07 2014 档案