在Eclipse上操作Hive-0.13.1-JDBC端口
摘要:fesh个人实践,欢迎经验交流!本文Blog地址:http://www.cnblogs.com/fesh/p/3877740.html 完成《在Hadoop-2.2.0集群上安装 Hive-0.13.1 with MySQL》后,这里具体介绍JDBC接口,如果是以集群中的节点作为客户端来访问H...
阅读全文
在Hadoop-2.2.0集群上安装 Hive-0.13.1 with MySQL
摘要:Hive可以理解为在Hadoop和HDFS之上为用户封装一层便于用户使用的接口。Hive需要将元数据存储在RDBMS中,这对于Hive的运行是非常重要的。
阅读全文
Apache Spark-1.0.1集群搭建
摘要:Spark是一个高效的分布式计算系统,相比Hadoop,它在性能上比Hadoop要高100倍。Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它克服了MapReduce在迭代式计算和交互式计算方面的不足,通过引入RDD(Resilient Distributed Datasets)数据表示模型,能够很好地解决MapReduce不易解决的问题。相比于MapReduce,Spark能够充分利用内存资源提高计算效率。
阅读全文
导航目录
摘要:一、基础学习Java正则表达式 Maven-3.2.2安装配置|转载:PuTTY的自动登录设置Ubuntu中vi常用命令|Ubuntu-12.04-server 配置修改静态 IP地址|二、大数据(Hadoop,Spark...)1)编译安装Ubuntu12.04-x64编译Hadoop2.2.0和...
阅读全文
Maven-3.2.2安装配置
摘要:(1)安装JDK,这里是1.7.0_51(2)Maven-3.2.2下载地址:http://mirrors.cnnic.cn/apache/maven/maven-3/3.2.2/binaries/apache-maven-3.2.2-bin.tar.gz(3)解压tar -zxvf apache-...
阅读全文
Mahout源码分析之 -- QR矩阵分解
摘要:一、算法原理请参考我在大学时写的《QR方法求矩阵全部特征值》,其包含原理、实例及C语言实现:http://www.docin.com/p-114587383.html二、源码分析这里有一篇文章《使用MapRedece进行QR分解的步骤》可以看看/** For an m x n matrix A wi...
阅读全文
Java正则表达式
摘要:1、匹配括号及括号内的内容,如“(**)”Pattern Pattern1 = Pattern.compile("\\(.+\\)") 2、匹配 汉字+数字,如“电视01”Pattern Pattern1 = Pattern.compile("[\u4e00-\u9fa5]+[0-9]+$");正...
阅读全文
IntelliJ IDEA13.1.3+Scala2.11.1环境搭建
摘要:Intellij IDEA的使用性非常好,是一个非常优秀的IDE,也是很好的scala开发工具。这里对构建Intellij IDEA的Scala开发环境进行介绍,包含在Windows环境和Ubuntu环境下的安装配置。
阅读全文