摘要:
作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363 前言: 根据之前博客搭的hadoop,对之前爬取出来的数据进行分析。 操作: 1.将爬取的数据集abcde.csv展示出来: 2.去掉标题行: 3.对数据集文件进行预处 阅读全文
摘要:
作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3310 前言: 搭建hadoop后,利用hdfs文件系统的命令进行文件的上传,下载,操作等。 目录操作: 在HDFS中为hadoop用户创建一个用户目录(hadoop用户) 在 阅读全文
摘要:
作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223 一、准备一个ubantu 系统 二、创建hadoop用户 创建 设密码 加入sudo权限 三、安装MySQL 更新软件资源库 安装mysql 开启mysql服务 四、安 阅读全文
摘要:
作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159 前言: 据课上要求,需爬取数据并生成文章,故选择爬去实习僧的招聘数据进行分析。 获取数据: 分析实习僧的地址可知,实习僧的地址组成为“域名”/“类别”/“页数”,此次我 阅读全文
摘要:
0.从新闻url获取点击次数,并整理成函数 newsUrl newsId(re.search()) clickUrl(str.format()) requests.get(clickUrl) re.search()/.split() str.lstrip(),str.rstrip() int 整理成 阅读全文
摘要:
作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2881 一. 简单说明爬虫原理 爬虫即是从网络中爬取数据,就python为例,利用requests模块访问网址,将访问后返回的html保存下来,并利用bs4进行分析,将想要的数 阅读全文
摘要:
作业来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2822 作业要求: 1. 下载一长篇中文小说。 下载了《粤港澳大湾区发展纲要》 2. 从文件读取待分析文本。 text=open('artical.txt',encoding 阅读全文
摘要:
作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753 作业要求: 文字作业要求言简意骇,用自己的话说明清楚。 编码作业要求放上代码,加好注释,并附上运行结果截图。 1.列表,元组,字典,集合分别如何增删改查及遍历。 列表: 阅读全文
摘要:
作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2684 1.字符串操作 解析身份证号:生日、性别、出生地等。 代码展示 运行效果 凯撒密码编码与解码 代码展示 运行效果 网址观察与批量生成 代码展示 运行效果 2.英文词频统 阅读全文
摘要:
作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639 1.浏览2019春节各种大数据分析报告 这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/290025769_313993 阅读全文