摘要: 启动hadooop jps查看服务是否启动 把本地文件传上数据库 启动hive建表 使用select命令查看结果 阅读全文
posted @ 2018-05-25 20:52 177黄南龙 阅读(112) 评论(0) 推荐(0) 编辑
摘要: 本次的所有操作均在当前用户目录下的/temp/2018-05-09中 通过wget下载压缩文件,命令如下: 在这之前,需要配置好环境,在.bashrc中加入下面的命令 下载后解压,之后启动hdfs,将解压文件放入系统中,命令如下 文件放入系统后可以编写mapper.py了,主要代码如下: impor 阅读全文
posted @ 2018-05-09 21:20 177黄南龙 阅读(140) 评论(0) 推荐(0) 编辑
摘要: 1. 以下关系型数据库中的表和数据,要求将其转换为适合于HBase存储的表并插入数据: 学生表(Student)(不包括最后一列) 学号(S_No) 姓名(S_Name) 性别(S_Sex) 年龄(S_Age) 课程(course) 2015001 Wangwu male 23 2015003 Ma 阅读全文
posted @ 2018-05-08 18:06 177黄南龙 阅读(100) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: utf-8 -*-import requestsfrom bs4 import BeautifulSoup as bs def gettext(url): header = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Wi 阅读全文
posted @ 2018-04-26 15:04 177黄南龙 阅读(142) 评论(0) 推荐(0) 编辑
摘要: str = requests.get('http://news.gzcc.cn/html/xiaoyuanxinwen/') str.encoding = 'utf-8' from bs4 import BeautifulSoup soup=BeautifulSoup(str.text,'html. 阅读全文
posted @ 2018-04-04 15:08 177黄南龙 阅读(97) 评论(0) 推荐(0) 编辑
摘要: 字符串练习: http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html 取得校园新闻的编号 tr=‘http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html‘ print(tr 阅读全文
posted @ 2018-03-21 16:33 177黄南龙 阅读(104) 评论(0) 推荐(0) 编辑
摘要: cd命令:切换目录 (1)切换到目录 /usr/local cd /usr/local (2)去到目前的上层目录 cd .. (3)回到自己的主文件夹 cd ~ ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 ls /usr mkdir命令:新建新目录 (5)进入/tmp目录,创建一个 阅读全文
posted @ 2018-03-13 22:44 177黄南龙 阅读(108) 评论(0) 推荐(0) 编辑
摘要: 近年来大数据技术的快速发展深刻改变了我们的生活、工作和思维方式。大数据研究专家舍恩伯格指出,大数据时代,人们对待数据的思维方式会发生如下三个变化:第一,人们处理的数据从样本数据变成全部数据;第二,由于是全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;第三,人类通过对大数据的处理,放弃对 阅读全文
posted @ 2018-03-07 15:16 177黄南龙 阅读(212) 评论(1) 推荐(0) 编辑
摘要: 1 #include<string.h> 2 #include<stdio.h> 3 #include<stdlib.h> 4 int main() 5 { 6 char p[30][30]; 7 char q[30][30]; 8 int line=0; 9 int n; 10 int i,j;  阅读全文
posted @ 2016-12-16 15:34 177黄南龙 阅读(124) 评论(0) 推荐(0) 编辑
摘要: # include<stdio.h># include<stdlib.h># include<string.h> int panduan(char tmp[]){char b[6][10] = {"begin", "if", "then", "while", "do", "end", };int k 阅读全文
posted @ 2016-12-16 15:22 177黄南龙 阅读(99) 评论(0) 推荐(0) 编辑