会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
GMUK
博客园
首页
新随笔
联系
订阅
管理
2019年6月20日
大数据应用期末总评
摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363 前言: 根据之前博客搭的hadoop,对之前爬取出来的数据进行分析。 操作: 1.将爬取的数据集abcde.csv展示出来: 2.去掉标题行: 3.对数据集文件进行预处
阅读全文
posted @ 2019-06-20 14:56 GMUK
阅读(190)
评论(0)
推荐(0)
2019年6月4日
分布式文件系统HDFS 练习
摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3310 前言: 搭建hadoop后,利用hdfs文件系统的命令进行文件的上传,下载,操作等。 目录操作: 在HDFS中为hadoop用户创建一个用户目录(hadoop用户) 在
阅读全文
posted @ 2019-06-04 21:43 GMUK
阅读(239)
评论(0)
推荐(0)
2019年5月16日
hadoop作业
摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223 一、准备一个ubantu 系统 二、创建hadoop用户 创建 设密码 加入sudo权限 三、安装MySQL 更新软件资源库 安装mysql 开启mysql服务 四、安
阅读全文
posted @ 2019-05-16 21:32 GMUK
阅读(206)
评论(0)
推荐(0)
2019年5月9日
爬虫综合大作业
摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159 前言: 据课上要求,需爬取数据并生成文章,故选择爬去实习僧的招聘数据进行分析。 获取数据: 分析实习僧的地址可知,实习僧的地址组成为“域名”/“类别”/“页数”,此次我
阅读全文
posted @ 2019-05-09 21:48 GMUK
阅读(398)
评论(0)
推荐(0)
2019年4月15日
爬取全部校园新闻
摘要: 0.从新闻url获取点击次数,并整理成函数 newsUrl newsId(re.search()) clickUrl(str.format()) requests.get(clickUrl) re.search()/.split() str.lstrip(),str.rstrip() int 整理成
阅读全文
posted @ 2019-04-15 21:55 GMUK
阅读(237)
评论(0)
推荐(0)
2019年3月29日
理解爬虫原理
摘要: 作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2881 一. 简单说明爬虫原理 爬虫即是从网络中爬取数据,就python为例,利用requests模块访问网址,将访问后返回的html保存下来,并利用bs4进行分析,将想要的数
阅读全文
posted @ 2019-03-29 17:45 GMUK
阅读(244)
评论(0)
推荐(0)
2019年3月25日
中文词频统计与词云生成
摘要: 作业来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2822 作业要求: 1. 下载一长篇中文小说。 下载了《粤港澳大湾区发展纲要》 2. 从文件读取待分析文本。 text=open('artical.txt',encoding
阅读全文
posted @ 2019-03-25 19:40 GMUK
阅读(209)
评论(0)
推荐(0)
2019年3月22日
复合数据类型,英文词频统计
摘要: 作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753 作业要求: 文字作业要求言简意骇,用自己的话说明清楚。 编码作业要求放上代码,加好注释,并附上运行结果截图。 1.列表,元组,字典,集合分别如何增删改查及遍历。 列表:
阅读全文
posted @ 2019-03-22 15:01 GMUK
阅读(169)
评论(0)
推荐(0)
2019年3月8日
字符串操作、文件操作,英文词频统计预处理
摘要: 作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2684 1.字符串操作 解析身份证号:生日、性别、出生地等。 代码展示 运行效果 凯撒密码编码与解码 代码展示 运行效果 网址观察与批量生成 代码展示 运行效果 2.英文词频统
阅读全文
posted @ 2019-03-08 17:21 GMUK
阅读(291)
评论(0)
推荐(0)
2019年3月4日
了解大数据的特点、来源与数据呈现方式
摘要: 作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639 1.浏览2019春节各种大数据分析报告 这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/290025769_313993
阅读全文
posted @ 2019-03-04 20:29 GMUK
阅读(215)
评论(0)
推荐(0)
下一页
公告