2019 年 6月随笔档案 - Molly134

【大数据应用技术】作业八｜爬虫综合大作业（下）

摘要：本次所以的要求来自：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3075 前言本次作业是爬取拉勾网python相关岗位的信息，通过爬取岗位id、城市、公司全名、福利待遇、工作地点、学历要求、工作类型、发布时间、职位名称、薪资、工作阅读全文

posted @ 2019-06-12 22:45 Molly134 阅读(1662) 评论(1) 推荐(0)

【大数据应用技术】作业十二｜Hadoop综合大作业

摘要：本次作业的要求来自：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3339 前言本次作业是在《爬虫大作业》的基础上进行的，在《爬虫大作业》中，我主要对拉勾网python岗位的招聘信息进行的数据爬取，最终得到了2641条数据存在一个名阅读全文

posted @ 2019-06-12 01:14 Molly134 阅读(4712) 评论(1) 推荐(0)

【大数据应用技术】作业十一｜分布式并行计算MapReduce

摘要：本次作业在要求来自：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3319 1.用自己的话阐明Hadoop平台上HDFS和MapReduce的功能、工作原理和工作过程。 1）HDFS HDFS是分布式文件系统，用来存储海量数据。HDF 阅读全文

posted @ 2019-06-03 17:00 Molly134 阅读(814) 评论(0) 推荐(0)

【大数据应用技术】作业十｜分布式文件系统HDFS 练习

摘要：本次作业的要求来自：https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3292 1.目录操作在HDFS中为hadoop用户创建一个用户目录（hadoop用户）在用户目录下创建一个input目录在HDFS的根目录下创建一个名称为inp 阅读全文

posted @ 2019-06-02 22:53 Molly134 阅读(356) 评论(0) 推荐(0)

晨环

06 2019 档案

公告