会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
TILY
博客园
首页
新随笔
联系
管理
订阅
2019年6月20日
Hadoop综合大作业
摘要: 本次作业的要求来自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363 前言 本次作业是在《爬虫大作业》的基础上进行的,在《爬虫大作业》中,我主要对拉勾网python岗位的招聘信息进行的数据爬取,最终得到了18813条数据存在一个
阅读全文
posted @ 2019-06-20 21:20 TILY
阅读(284)
评论(0)
推荐(0)
2019年5月17日
安装Hadoop
摘要: 作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223 1.安装Linux,MySql 将相关的文件更改配置后,进行首次的格式化并进行启动: 执行Namenode的格式化 启动Hadoop: 通过命令jps可以查看各个节点所
阅读全文
posted @ 2019-05-17 15:03 TILY
阅读(128)
评论(0)
推荐(0)
2019年4月15日
爬取全部的校园新闻
摘要: 作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3002 0.从新闻url获取点击次数,并整理成函数 newsUrl newsId(re.search()) clickUrl(str.format()) requests.ge
阅读全文
posted @ 2019-04-15 17:07 TILY
阅读(153)
评论(0)
推荐(0)
2019年4月2日
理解爬虫原理
摘要: 1. 简单说明爬虫原理 爬虫:请求网站并提取数据的自动化程序 百科:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 2. 理解爬虫开发过程 1
阅读全文
posted @ 2019-04-02 10:16 TILY
阅读(323)
评论(0)
推荐(0)
2019年3月25日
复合数据类型,英文词频统计
摘要: 作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753 1.列表,元组,字典,集合分别如何增删改查及遍历。 列表: 增: 1)append()增加到最后 2)insert()方法:在列表指定的位置上增加一个元素 3)e
阅读全文
posted @ 2019-03-25 17:06 TILY
阅读(232)
评论(0)
推荐(0)
2019年3月11日
字符串操作、文件操作,英文词频统计预处理
摘要: 1.字符串操作: 解析身份证号:生日、性别、出生地等。 代码: 运行结果: 凯撒密码编码与解码 代码: 运行结果: 网址观察与批量生成 代码: 运行结果: 2.英文词频统计预处理 下载一首英文的歌词或文章或小说。 将所有大写转换为小写 将所有其他做分隔符(,.?!)替换为空格 分隔出一个一个的单词
阅读全文
posted @ 2019-03-11 16:28 TILY
阅读(233)
评论(0)
推荐(0)
2019年3月1日
了解大数据的特点、来源与数据呈现方式
摘要: 这个作业的要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639 1.浏览2019春节各种大数据分析报告,例如: 这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/2900257
阅读全文
posted @ 2019-03-01 17:14 TILY
阅读(244)
评论(0)
推荐(0)
2018年10月24日
四则运算升级
摘要: 作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2213 GitHub远程地址:https://github.com/Tily288/Tily 一、基本要求 从个人项目出发,将程序改造成一个单机带用户界面(不是控制台)的程序,
阅读全文
posted @ 2018-10-24 21:37 TILY
阅读(265)
评论(0)
推荐(0)
2018年10月11日
初级四则运算
摘要: 作业要求地址:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2166 Github地址:https://github.com/Tily288/Tily 一、时间计划与实际使用时间 二、题目要求 任何编程语言都可以,命令行程序接受一个数
阅读全文
posted @ 2018-10-11 15:10 TILY
阅读(315)
评论(1)
推荐(0)
2018年9月17日
分布式版本控制系统Git的安装与使用
摘要: 作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2103 1.下载安装配置用户名和邮箱。 配置用户名和邮箱 查看用户名和邮箱地址 2. 创建工作目录并通过git init命令把这个目录变成Git可以管理的仓库。 3. 在工作目
阅读全文
posted @ 2018-09-17 18:42 TILY
阅读(168)
评论(1)
推荐(0)
下一页
公告