2019年12月21日
摘要: 一、主题式网络爬虫设计方案(15分) 1.主题式网络爬虫名称:爬取华图教育官网2019年福建公务员招聘岗位信息 2.主题式网络爬虫爬取的内容与数据特征分析:爬取2019年福建公务员招聘岗位信息3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 1).从网络上获取华图教育福建公务员招聘岗位信息内 阅读全文
posted @ 2019-12-21 11:04 .yr 阅读(356) 评论(0) 推荐(0) 编辑
  2019年10月29日
摘要: 1.注册中国大学MOOC 2.选择北京理工大学嵩天老师的《Python网络爬虫与信息提取》MOOC课程 3.学习完成第0周至第4周的课程内容,并完成各周作业 4.提供图片或网站显示的学习进度,证明学习的过程。 5.写一篇不少于1000字的学习笔记,谈一下学习的体会和收获。 第一周学习了Request 阅读全文
posted @ 2019-10-29 17:34 .yr 阅读(355) 评论(0) 推荐(0) 编辑
  2019年10月14日
摘要: 一、读入titanic.xlsx文件,按照教材示例步骤,完成数据清洗。 1. 删除无效列 2. 删除重复值 3. 统计空值个数 4. 处理缺失值 5. 异常值处理 二、对titanic数据集完成以下统计操作 1.统计乘客死亡和存活人数 2.统计乘客中男女性别人数 3.统计男女获救的人数 4.统计乘客 阅读全文
posted @ 2019-10-14 20:03 .yr 阅读(185) 评论(0) 推荐(0) 编辑
  2019年9月23日
摘要: 1.创建一个边界值为1而内部都是0的数组,图例如下:[提示:]解此题可以先把所有值都设置为1,这是大正方形;其次,把边界除外小正方形全部设置为0。本题用到numpy的切片原理。多维数组同样遵循x[start:stop:step]的原理。 2.在数组主对角线上创建一个值为1,2,3,4的5x5矩阵,图 阅读全文
posted @ 2019-09-23 15:37 .yr 阅读(229) 评论(0) 推荐(0) 编辑