天龙八部谁是主角?(MR词频统计)
摘要:天龙八部主要是对段誉、萧峰、虚竹三人的描写,那么谁才是真正的主角呢?这次姑且认为小说中谁的出现次数多谁是主角。 实验在linux环境下 首先下载天龙八部wget http://labfile.oss.aliyuncs.com/hadoop/tlbbtestfile.txt安装结巴分词sudo pip
阅读全文
elasticsearch CURL命令
摘要:CURL命令简单可以认为是在命令行下访问url的一个工具,是利用URL语法在命令行方式下工作的开源文件传输工具,使用curl可以简单实现常见的get/post请求。 首先需要在后台启动elasticsearchelasticsearch-2.2.0/bin/elasticsearch -d启动kib
阅读全文
HBase Shell基本操作
摘要:首先启动hadoop集群与hbase服务start-all.shhbase-1.1.3/bin/start-hbase.sh接下来使用hbase shell命令来连接正在运行的Hbase实例,该命令位于HBase安装包下的bin/目录hbase-1.1.3/bin/hbase shell 查看HBa
阅读全文
hive on spark
摘要:https://www.shiyanlou.com/courses/809/labs/2850/document 启动mysql服务sudo service mysql start 启动hive(jps出现RunJar)并查看数据库和表hive/bin/hive --service metastor
阅读全文