大数据(3):基于sogou.500w.utf8数据Hbase和Spark实践
摘要:1. HBase安装部署操作 a) 解压HBase安装包tar –zxvf hbase-0.98.0-hadoop2-bin.tar.gzb) 修改环境变量 hbase-env.shexport JAVA_HOME=/usr/java/jdk1.7.0_71/c) 修改配置文件 hbase-site
阅读全文
posted @
2017-11-19 19:32
monster_101
阅读(953)
推荐(0)
大数据(2):基于sogou.500w.utf8数据hive的实践
摘要:一.环境的搭建 1.安装配置mysql rpm –ivh MySQL-server-5.6.14.rpm rpm –ivh MySQL-client-5.6.14.rpm 启动mysql 创建hive用户 grant all on *.* to hadoop@’%’ identified by ‘h
阅读全文
posted @
2017-11-19 19:17
monster_101
阅读(2842)
推荐(0)
大数据(1):基于sogou.500w.utf8数据的MapReduce程序设计
摘要:环境:centos7+hadoop2.5.2 1.使用ECLIPS具打包运行WORDCOUNT实例,统计莎士比亚文集各单词计数(文件SHAKESPEARE.TXT)。 ①WorldCount.java 中的main函数修改如下: ②导出WordCount的jar包: export->jar file
阅读全文
posted @
2017-11-17 23:51
monster_101
阅读(2434)
推荐(0)