摘要: 多线程是一个很有用的东西,它使的系统可以同时运行多个任务,提高程序的执行效率。大家平时可能没有注意到,其实我们电脑能同时执行多个程序的基本原理就是多线程。 每一个程序都是一个进程,而线程则是进程下独立的执行单元。 如果把一台电脑当成一个工业园区,那么这个电脑能容纳的工厂越多,说明这个电脑越好,而进程 阅读全文
posted @ 2018-09-10 00:47 商软3许怀鹏222 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 二叉树的创建和遍历 二叉树的创建是让我有点头疼的东西,因为我确实不太明白,但是让我写我却能较好的表达出来。 现在来试试如何创建一个二叉树 这是一个完全二叉树,其输入数组表达出来是这样的 [1,2,4,0,0,5,0,0,3,6,0,0,7,0,0] 其中0表示没有指向数值。所以这就是一个二叉树创建的 阅读全文
posted @ 2018-08-07 20:45 商软3许怀鹏222 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 什么是泛型? 型就是数据类型参数化。就是说原本定死的数据类型像方法中的形参一样,数据是不确定的,使用的时候由人传进去,泛型就是这样,数据类型不确定了。使用的时候再确定就可以了。 泛型的特点 是JDK1.5的新特性 泛型可以使用在方法上,类上,接口上 泛型变量可以理解为是某种数据类型的占位符 泛型变量 阅读全文
posted @ 2018-08-07 20:42 商软3许怀鹏222 阅读(400) 评论(1) 推荐(0) 编辑
摘要: 要求: 1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 网上下载经典长篇英文小说The Great Gatsby,保存到wc文件中,命名为xhp.txt。 启动hadoop集群 将wc文件夹的xhp.txt上传文件至hdfs的data文件夹 启动hive 阅读全文
posted @ 2018-05-24 15:36 商软3许怀鹏222 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 1.启动hadoop start-all.sh 2.Hdfs上创建文件夹 hdfs dfs -mkdir testinput hdfs dfs -ls /user/hadoop 3.上传文件至hdfs hdfs dfs -put ./test.txt testinput hdfs dfs -ls / 阅读全文
posted @ 2018-05-17 08:29 商软3许怀鹏222 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 1.编写map函数,reduce函数 (1)创建mapper.py文件 cd /home/hadoop/wc gedit mapper.p (2)mapper函数 cd /home/hadoop/wc gedit reducer.py 放到HDFS上运行 下载并上传文件到hdfs上 阅读全文
posted @ 2018-05-11 10:21 商软3许怀鹏222 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 1. 以下关系型数据库中的表和数据,要求将其转换为适合于HBase存储的表并插入数据: 学生表(Student)(不包括最后一列) 学号(S_No) 姓名(S_Name) 性别(S_Sex) 年龄(S_Age) 课程(course) 2015001 Zhangsan male 23 2015003 阅读全文
posted @ 2018-05-09 22:05 商软3许怀鹏222 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 一. 1/在本地Linux文件系统的“/home/hadoop/”目录下创建一个文件txt,里面可以随意输入一些单词. cd /usr/local/hadoop 2.在本地查看文件位置(ls) 2.在本地查看文件位置(ls) touch test.txt 3.在本地显示文件内容 cat test.t 阅读全文
posted @ 2018-04-26 11:06 商软3许怀鹏222 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 先把代码弄出来 然后就开始生成词云 我选择的网站是李白的古诗网站,中间遇到很多问题,最大的莫过于找不到词,其次是词云的安装wordcloud总是失败。 找不到词在同学帮助下成功了,词云也是如此,通过安装包,而不是通过pycharm安装。 可见李白最喜欢三件东西:拒绝,百日,成仙 阅读全文
posted @ 2018-04-26 10:59 商软3许怀鹏222 阅读(869) 评论(0) 推荐(0) 编辑
摘要: 1. 用正则表达式判定邮箱是否输入正确。 2. 用正则表达式识别出全部电话号码。 3. 用正则表达式进行英文分词。re.split('',news) 4. 使用正则表达式取得新闻编号 5. 生成点击次数的Request URL 6. 获取点击次数 7. 将456步骤定义成一个函数 def getCl 阅读全文
posted @ 2018-04-11 13:19 商软3许怀鹏222 阅读(143) 评论(0) 推荐(0) 编辑